0代碼微調(diào)大模型火了,只需5步,成本低至150塊
明敏 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
0代碼微調(diào)一個大模型,成本不到20美元(人民幣約144元)?
過程也非常簡單,只需5步。
如LLaMA、GPT、StableLM等爆火的開源生成式模型,都能搞定。
這就是Monster API,一個最新火起來的API平臺。
有人覺得這個開源領(lǐng)域的新工作,能改寫AI開發(fā)的游戲規(guī)則,加速AI應(yīng)用的速度。
還有人興奮提問,之后會接入GPT-3/GPT-4嗎?
所以,它具體是怎么實現(xiàn)的?
五步零代碼搞定
簡單理解,Monster API就是將微調(diào)步驟盡可能簡易化,讓開發(fā)者不用再手動進(jìn)行一系列設(shè)置,同時也提供便宜的GPU資源及內(nèi)存優(yōu)化。
具體過程如下:
第一步,選擇一個模型進(jìn)行微調(diào)。
比如LLaMA-7B、GPT-J-6B、StableLM-7B等,Monster API提供了至少10個基礎(chǔ)大模型。
第二步,選擇或創(chuàng)建微調(diào)任務(wù)。比如指令微調(diào)、文本分類等,或者自定義任務(wù)。
第三步,選擇一個HuggingFace數(shù)據(jù)集。
Monster API可以無縫集成HuggingFace數(shù)據(jù)集,可選擇范圍很大;還可以根據(jù)任務(wù)類型推薦數(shù)據(jù)集。
并且不用自己手動操作,就能自動設(shè)置好格式。
第四步,設(shè)置超參數(shù)。
第五步,檢查和提交。
在設(shè)置好如上所有步驟后,確定沒有錯誤就可以提交了。
Monster API表示可以通過WandB上的日志來監(jiān)測任務(wù)。
在其博客中寫道,用DataBricks Dolly 15k微調(diào)LLaMA-7B完成3個epouch,成本僅需不到20美元(折合人民幣約144元)。
官網(wǎng)顯示,注冊用戶后會贈送2500積分。會員分為三檔,收費分別是每月9美元/29美元/39美元。
除了微調(diào)以外,Monster API還提供各種生成式AI的API接口,并表示成本比其他方案低80%。
背后公司已獲110萬美元融資
消息顯示,Monster API背后公司拿下了110萬美元的種子前資金(pre-seed funding)。
這家AI初創(chuàng)公司給自己的定位是要做“GPU領(lǐng)域的愛彼迎”,把全世界分散的GPU資源實現(xiàn)靈活調(diào)度,讓開發(fā)者們能夠以更低的價格使用。
創(chuàng)始人是兩兄弟Gaurav Vij和Saurabh Vij。
其中Gaurav Vij還創(chuàng)立了一家CV公司,正是因為CV公司需要面臨巨大的云計算資本,才啟發(fā)了他們要做這樣一個平臺。
Saurabh Vij之前是歐洲核研究中心的粒子物理學(xué)家,同時也研究分布式計算。
兄弟倆表示在經(jīng)過多輪技術(shù)迭代后,他們優(yōu)化了消費級GPU在機(jī)器學(xué)習(xí)任務(wù)上的性能,使得運行Whisper AI模型的成本相較于AWS平臺降低了90%,所以他們就想著為什么不利用這個方法來幫助數(shù)以萬計的開發(fā)者們。
同時他們透露公司的一個客戶使用他們的分散的GPU計算資源,已經(jīng)節(jié)省了30萬美元。
參考鏈接:
[1]https://blog.monsterapi.ai/no-code-fine-tuning-llm/
[2]https://www.enterpriseai.news/2023/06/09/monster-api-launches-the-airbnb-of-gpus-with-1-1m-pre-seed/
— 完 —
量子位 QbitAI · 頭條號簽約
關(guān)注我們,第一時間獲知前沿科技動態(tài)