I ricercatori affermano di aver addestrato un modello di base da zero per circa 1.500 dollari
• I ricercatori di Sapient hanno sviluppato un modello di ragionamento da 1 miliardo di parametri, chiamato HRM-Text, addestrandolo da zero per un costo di circa 1.500 dollari. • Il modello è stato addestrato su 40 miliardi di token e ha raggiunto livelli di prestazioni competitivi rispetto a modelli più grandi, con parametri compresi tra 2 e 7 miliardi. • Questa svolta dimostra che il pre-addestramento fondamentale non è più un'esclusiva delle istituzioni più ricche, consentendo a organizzazioni più piccole di costruire modelli di ragionamento capaci a costi contenuti.
venturebeat.com


