Google 最近一年來承受著 OpenAI 帶來的極大壓力,感覺公司內部不斷重組,產品名稱也是一直在變化。由於我最近花了比較多時間在研究 Google 的 Gemini 技術,過程一直不斷被「命名」苦惱,直到最近才比較清楚整個來龍去脈。這篇文章我打算來整理一下 Google 的 Gemini 到底推出過多少「相似」的名稱,包含分類方式、產品名稱、舊名稱、新名稱、變化的名稱、套件名稱、模型名稱、工具名稱、函式庫名稱等等,坐好啊,馬上起飛!😅
一個主軸
幾本上 Google 的 AI 產品線非常大,不過 Gemini
是屬於 Generative AI 這個分支下的產品,完全是生成式 AI 的範疇。
在這個主軸上,你可能會看到三種不同的說法:
-
Generative AI
-
Google Cloud generative AI
-
Google Cloud Generative AI (大小寫我視為不同)
讓消費者體驗 AI 的產品
為了讓所有人都能體驗 Google AI 的強大,Google 也推出了一個消費者體驗的網站,名叫:Gemini
如果我們提到 Gemini AI
的話,通常講的並不是 API 服務,而是這個給消費者的網站!
給開發者的 API 服務
基本上 Google 提供的 Gemini API 有兩大分類:
-
Google AI Gemini API
(消費級) (沒有品質保證)
官網: https://ai.google.dev/
免費,限制 60 QPM (Queries Per Minute)
其他可能的別名: Gemini API on Google AI
、Generative Language API
(在 GCP Console 上看到的名稱)
單講 Gemini API
可能容易讓人誤解,因為這是一種比較籠統的說法,不過通常代表 Google AI Gemini API
這種。
-
Vertex AI Gemini API
(企業級) (有品質保證)
官網: https://cloud.google.com/vertex-ai/
需綁定 GCP 付款帳戶,依照呼叫的 Tokens 數計費。
其他可能的別名:
Gemini API on Vertex AI
Gemini API in Google Cloud Vertex AI
Google Cloud Vertex AI Gemini API
備註: 在應用程式開發的領域中單講 Gemini AI
其實是不太精準的寫法,我們不會在用 API 的時候使用這個名字,但偶爾會看到有人這樣寫。( AI 與 API 傻傻分不清楚? )
Gemini 提供了三種模型大小,但目前只有一種有公開:
-
Gemini Nano
(未公開)
微型生成式模型,專為移動裝置和邊緣裝置而設計。
-
Gemini Pro
(已有 API 可使用)
介於規模與效能之間的生成式模型,已公開。
-
Gemini Ultra
(未公開)
目前規模最大的 Gemini 生成式模型。
Gemini 提供的模型主要分成三種,在「模型代碼」方面各有不同的命名方式:
-
最新版 ( Latest
)
最前沿版本。基礎模型會定期更新,也可能為預覽版本。僅供「探索性測試」應用程式和「原型」使用此版本。
命名方式: <model>
-<generation>
-<variation>
-latest
命名範例: gemini-1.0-pro-latest
-
最新穩定版 ( Latest stable
)
最新穩定版本。
命名方式: <model>
-<generation>
-<variation>
命名範例: gemini-1.0-pro
-
特定穩定版 ( Stable
)
特定的穩定模型版本。
命名方式: <model>
-<generation>
-<variation>
-<version>
命名範例: gemini-1.0-pro-001
Gemini 的模型還擁有許多變體(variations),各自擁有不同的能力與限制,建議到 Model variations 查看細節。
-
Gemini 1.5 Pro (Preview only)
多模態模型,可輸入文字和圖像,並生成相關的文字。
模型代碼: models/gemini-1.5-pro
-
Gemini Pro
文字模型,只能輸入文字,並生成相關的文字。
模型代碼: models/gemini-pro
- 最新版:
gemini-1.0-pro-latest
- 最新穩定版:
gemini-1.0-pro
- 特定穩定版:
-
Gemini 1.0 Pro Vision
多模態模型,可輸入文字和圖像,並生成相關的文字。
模型代碼: models/gemini-pro-vision
- 最新版:
gemini-1.0-pro-vision-latest
- 最新穩定版:
gemini-1.0-pro-vision
- 特定穩定版:
gemini-1.0-pro-vision-001
-
Embedding
多模態模型,可輸入文字和圖像,並生成相關的文字。
模型代碼: models/embedding-001
-
AQA (Attributed Question & Answering)
問答模型,可輸入文字,並生成相關的文字。
模型代碼: models/aqa
-
PaLM 2
這是 Gemini 前一代的語言模型。
- 最新版:
text-bison
text-bison-32k
- 特定穩定版:
text-bison-32k@002
text-bison@001
text-bison@002
text-unicorn@001
Gemini 的 API 也有區分版本,不過這裡的版本是指 API 的版本,不是模型的版本。
我以我常用的 API 端點為例,我基本上用的是 v1beta
版本,可以體驗比較多功能,例如 Generate Content - Function calls
:
https://generativelanguage.googleapis.com/v1beta/models/gemini-1.0-pro-001:generateContent?key={ApiKey}
所以在呼叫 Gemini API 時,要注意你呼叫的 API 端點上使用的版本:
-
v1
穩定版本。在呼叫 Vertex AI Gemini API
的時候,由於會用在生產環境,所以通常都是用 v1
穩定版本。
穩定版本中的功能在主要版本的生命週期內都獲得完整支持。
如果存在重大變更,將創建下一個主要版本,並在合理時間後棄用現有版本。次要變更可能會引入到 API 中,而不會更改主要版本號。
-
v1beta
此版本包含可能正在開發的搶鮮體驗功能,目前大多數 Google AI Gemini API
的 API 都是以 v1beta
為主。
v1beta
可能會快速迭代更新且存在重大變更。也不能保證 Beta 版本中的功能會遷移到穩定版本。
由於其不穩定性,您不應使用此版本啟動生產環境的應用程式。
完整的清單可以看 API versions explained 文件。
Gemini 的 API 實驗工具
Google 提供了一個專門為開發人員打造的實驗工具,讓開發者可以在瀏覽器中直接體驗 Gemini 的 API 功能,不過,他也直接分成了兩套:
-
Google AI Studio (舊名: MakerSuite
)
這是一個網頁版的實驗工具,可以直接在瀏覽器中體驗 Google AI Gemini API
的各種能力。
-
Vertex AI Studio
這是一個網頁版的實驗工具,可以直接在瀏覽器中體驗 Vertex AI Gemini API
的各種能力。
Geimin API 的 Python SDK
我們在 Google AI Studio 或 Vertex AI Studio 中體驗完 API 功能後,都有現成的 Get Code
功能,可以很方便的用來取得相對應的 Python
程式碼或 cURL
命令,不過兩個不同版本的 Python SDK 套件名稱差異還蠻大的。
總結
Gemini 這麼多種花式的命名,老實跟你說,連 Google 的官方文件也會寫錯,更別說初入 Google Cloud 叢林的小白兔了。😅
我在實驗的過程中,有很明顯的發現,Google AI Gemini API
真的相當不穩定,每天的狀況都不太一樣。但是相對的 Vertex AI Gemini API
就穩定多了,而且回應速度也非常穩定,我覺得可靠許多!
最後就是我個人使用 Gemini
的小小心得:
-
給一般大眾的 Gemini 網站功能非常多,在輸入提示詞的時候,你的提示詞會被系統自動加料,所以基本上不太能用來做提示工程的相關實驗。
-
Google AI Studio 雖然感覺上背後就是直接呼叫 Google AI Gemini API
,但實際上有套了一層殼,Google 還是有在這個介面背後還是有偷偷做了一些事,應該是例外處理或負責任 AI 等過濾工作,但我無從得知他們實作做了哪些調整,總之跟我自己呼叫 API 的實際狀況是有差距的。
-
Vertex AI Studio 也是同理,背後也是套了一層殼。
-
即便兩套 AI Studio
都有套殼,但是拿來做提示工程的實驗是完全沒問題的!👍
-
要使用 Gemini API 來開發應用程式,目前有兩個截然不同的 Python SDK 套件,不要選錯!
相關連結
- Gemini
- Google AI Gemini API
- Vertex AI Gemini API
- 文件翻譯