Hạn mức

Tài liệu này liệt kê hạn mức và giới hạn hệ thống áp dụng cho Gemini cho Google Cloud.

  • Hạn mức chỉ định lượng tài nguyên dùng chung, có thể đếm mà bạn có thể sử dụng. Hạn mức được xác định bởi các dịch vụ Google Cloud , chẳng hạn như Gemini cho Google Cloud.
  • Giới hạn hệ thống là các giá trị cố định không thể thay đổi.

Google Cloud sử dụng hạn mức để đảm bảo tính công bằng và giảm mức sử dụng cũng như tình trạng thiếu tài nguyên. Hạn mức giới hạn lượng tài nguyênGoogle Cloud mà dự án Google Cloud của bạn có thể sử dụng. Hạn mức áp dụng cho một loạt loại tài nguyên, bao gồm cả phần cứng, phần mềm và thành phần mạng. Ví dụ: hạn mức có thể giới hạn số lượng lệnh gọi API đến một dịch vụ, số lượng trình cân bằng tải mà dự án của bạn sử dụng đồng thời hoặc số lượng dự án mà bạn có thể tạo. Hạn mức bảo vệ cộng đồng người dùngGoogle Cloud bằng cách ngăn chặn tình trạng quá tải dịch vụ. Hạn mức cũng giúp bạn quản lý tài nguyên Google Cloud của riêng mình.

Hệ thống Hạn mức trên đám mây thực hiện những việc sau:

Trong hầu hết các trường hợp, khi bạn cố gắng sử dụng nhiều tài nguyên hơn hạn mức cho phép, hệ thống sẽ chặn quyền truy cập vào tài nguyên đó và tác vụ bạn đang cố gắng thực hiện sẽ không thành công.

Hạn mức thường áp dụng ở cấp dự án. Google Cloud Việc bạn sử dụng một tài nguyên trong một dự án không ảnh hưởng đến hạn mức hiện có của bạn trong một dự án khác. Trong một dự án Google Cloud , hạn mức được chia sẻ trên tất cả ứng dụng và địa chỉ IP.

Ngoài ra, còn có hạn mức hệ thống đối với tài nguyên Gemini. Không thể thay đổi các giới hạn của hệ thống.

Số yêu cầu mỗi giây

Gemini for Google Cloud thực thi hạn mức về số yêu cầu mỗi giây cho mỗi người dùng trong một dự án.

Hạn mức Giá trị
Số yêu cầu mỗi giây 2

Số yêu cầu mỗi ngày

Gemini cho Google Cloud thực thi hạn mức cho tổng số yêu cầu mỗi ngày cho mỗi người dùng trong một dự án.

Hạn mức Giá trị
Số yêu cầu mỗi ngày đối với Gemini Code Assist hoặc Gemini trong các yêu cầu mã BigQuery, chẳng hạn như tạo mã và hoàn thành mã. 6000
Số yêu cầu mỗi ngày đối với tính năng trò chuyện, hình ảnh trực quan, quét bảng thông tin chi tiết về dữ liệu, tạo siêu dữ liệu, chuẩn bị dữ liệu và các yêu cầu khác hiển thị phản hồi trong bảng điều khiển Cloud Assist (Hỗ trợ trên đám mây) trong bảng điều khiển Google Cloud và IDE. 960

Hạn mức cho Gemini Code Assist

Gemini Code Assist thực thi hạn mức cho một số tính năng.

Hạn mức Giá trị
Nhận biết cơ sở mã cục bộ Cửa sổ ngữ cảnh 128.000 token
Kho lưu trữ tuỳ chỉnh mã 20.000

Hạn mức cho Gemini trong BigQuery

Đối với các tính năng hỗ trợ lập trình, hạn mức cho các yêu cầu mã Gemini Code Assist và Gemini trong BigQuery đối với các tính năng như hoàn thành mã và tạo mã là giống nhau.

Đối với những khách hàng sử dụng Gemini trong BigQuery với tính năng điện toán theo yêu cầu của BigQuery hoặc với phiên bản Enterprise hoặc Enterprise Plus, hạn mức cho các tính năng nâng cao như thông tin chi tiết về dữ liệu được cung cấp dựa trên mức sử dụng trung bình hằng ngày của TiB được quét hoặc số giờ theo khung giờ trong tháng dương lịch đầy đủ gần nhất. Hạn mức này áp dụng cho cấp tổ chức và áp dụng cho tất cả dự án trong tổ chức đó. Hạn mức được làm tròn lên đến mức sử dụng 100 giờ khe gần nhất.

Hạn mức trên mỗi 100 giờ khe (mức sử dụng trung bình hằng ngày của phiên bản Enterprise hoặc Enterprise Plus) hoặc trên mỗi TiB được quét bằng mô hình điện toán theo yêu cầu Giá trị
Số yêu cầu mỗi ngày đối với tính năng trò chuyện, hình ảnh trực quan, quét bảng và các yêu cầu khác hiển thị câu trả lời trong bảng điều khiển Cloud Assist trong bảng điều khiển Google Cloud . 5

Ví dụ: Một tổ chức có gói đặt trước phiên bản Enterprise với 100 khung giờ làm việc làm cơ sở sẽ sử dụng trung bình 2.400 khung giờ làm việc mỗi ngày (100 khung giờ làm việc * 24 giờ = 2.400 khung giờ làm việc). Do đó, trong tháng tiếp theo, họ sẽ nhận được các hạn mức hằng ngày sau:

  • 120 cuộc trò chuyện, hình ảnh trực quan, lượt quét bảng thông tin chi tiết về dữ liệu và lượt tạo siêu dữ liệu tự động mỗi ngày

Nếu tổ chức của bạn chưa mua phiên bản BigQuery Enterprise, phiên bản Enterprise Plus hoặc bộ nhớ tính toán theo yêu cầu (TiB) cho đến thời điểm này, thì sau lần sử dụng đầu tiên, bạn sẽ nhận được hạn mức mặc định sau đây cho tháng dương lịch đầu tiên:

  • 250 cuộc trò chuyện, hình ảnh trực quan, lượt quét bảng thông tin chi tiết về dữ liệu và lượt tạo siêu dữ liệu tự động mỗi ngày

Nếu bạn bắt đầu sử dụng tính năng điện toán theo yêu cầu, đặt trước phiên bản Enterprise hoặc Enterprise Plus vào giữa tháng, thì hạn mức mặc định sẽ áp dụng cho đến cuối tháng tiếp theo.

Yêu cầu tăng hạn mức

Để điều chỉnh hầu hết hạn mức, hãy sử dụng bảng điều khiển Google Cloud . Để biết thêm thông tin, hãy xem phần Yêu cầu điều chỉnh hạn mức.