Alternatives de codi obert a GPT: Poden competir realment?

_codigoabierto_gpt_Extracció OCR IA factures albarans - machine learning amb intel·ligència artificial programari comptabilitat AI OCR Dijit.app albarans factures automatitza extracció dades factures i albarans OCR IA Dijit.app

OpenAI és àmpliament conegut al camp de la Intel·ligència Artificial generativa, però no és l'únic jugador en el joc. Hi ha alternatives de codi obert a GPT que ofereixen un rendiment similar, més transparència i un menor requeriment de potència computacional. Aquestes alternatives són atractives per a aquells usuaris que valoren la privadesa de les seves dades i volen tenir un major control sobre el procés d'entrenament. Però, realment poden competir amb els models d'OpenAI?

Desafiaments i temors a l'adopció d'IA generativa

La IA generativa és la tendència tecnològica de l'any, atraient una gran atenció, inversió i finançament. Tot i això, la seva adopció no està exempta de preocupacions i incerteses. Tot i que ofereix beneficis significatius, com l'eficiència i l'estalvi de costos, també s'escolten notícies sobre filtracions de dades, demandes contra empreses d'IA generativa i prohibicions d'eines com ara ChatGPT a causa de preocupacions de seguretat de dades.

El codi obert pot ser la solució?

El codi obert pot ser la solució a aquests desafiaments i temors. En aquest article, explorarem les alternatives disponibles a ChatGPT i els models base de GPT. Un informe recent de Digital Ocean mostra que més del 30% de les startups i les PIMES i el 28% de les corporacions trien solucions de codi obert per a la meitat del programari. A més, el 80% de les empreses enquestades esperen augmentar aquests valors per a les tecnologies emergents. Per a aquells que ja han optat pel codi obert, és una part clau de la vostra estratègia de seguretat.

Flexibilitat i personalització

La segona raó, declarada pel 79% dels que utilitzen solucions de codi obert a les seves empreses, és que el codi obert proporciona flexibilitat per personalitzar solucions per satisfer necessitats específiques i estàndards de l'empresa. En el cas de la IA generativa, és particularment important supervisar el procés d'entrenament i entendre'n els possibles biaixos.

Alternatives populars a GPT

LLAMA

LLaMA, desenvolupat al laboratori de recerca d'IA de Meta, és un dels models de codi obert més importants. Tot i que els seus paràmetres poden semblar menys impressionants en comparació amb els de GPT-4 o GPT-3, no cal subestimar-ho. Tot i tenir menys paràmetres, els models LLaMA van ser entrenats amb un nombre més gran de tokens, la qual cosa significa que són més fàcils de reentrenar i ajustar per a casos d'ús específics. Com a resultat, LLaMA-13B supera GPT-3 en les tasques de raonament de sentit comú. Tot i això, l'accés a LLaMA està limitat a investigadors acadèmics, organitzacions afiliades al govern, la societat civil i laboratoris de recerca, cas per cas.

OPT

El model de llenguatge Transformer Preentrenat Obert (OPT), llançat per Meta el maig de 2022, conté 175B paràmetres (igual que GPT-3) i va ser entrenat en múltiples conjunts de dades públiques. Malauradament, igual que LLaMA, OPT està actualment disponible només per a finalitats de recerca sota una llicència no comercial.

MPT-7B

MPT-7B és part dels models MosaicPretrainedTransformer (MPT) desenvolupats per MosaicML. Va ser entrenat en 1T de tokens de text i codi en anglès; es diu que està optimitzat per a un entrenament i inferència eficients i, ho hem d'admetre, sembla molt prometedor com a alternativa de codi obert a GPT.

GPT-J i GPT-NeoX

GPT-J i GPT-NeoX són models de generació de text desenvolupats per EleutherAI. Tot i ser més petits en mida, aquests models ofereixen un rendiment gairebé idèntic als models Babbage i Curie d'OpenAI (família GPT-3) en tasques estàndard de modelatge de llenguatge. El millor de tot és que aquests models són completament gratuïts per utilitzar i permeten lús comercial.

Dolly

Dolly és un altre model de llenguatge de codi obert que es pot utilitzar en chatbots, resums de text i potenciar motors de cerca bàsics. És important destacar que està llicenciat per a ús de recerca i comercial.

gestion_documental_ocr_pymes

Chatbots tipus ChatGPT construïts amb models de IA generativa

Alpaca

Alpaca, desenvolupat com un projecte de recerca a la Universitat de Stanford, aborda el problema creixent d'al·lucinacions i biaixos en els models d'IA generativa. Tot i això, el seu ús està limitat a la investigació acadèmica i està prohibit el seu ús comercial.

Vicuna

Vicuna, desenvolupat per l'equip d'UC Berkeley, CMU, Stanford i UC San Diego, va ser entrenat ajustant LLAMA a 70K converses compartides per usuaris recopilades de ShareGPT amb APIs públiques. Encara que utilitza menys paràmetres que ChatGPT (13B en comparació amb 175B), Vicuna va ser presentat com un xatbot de codi obert que impressiona GPT-4 amb qualitat de ChatGPT al 90% i va obtenir bons resultats en les proves realitzades.

GPT4All

GPT4All, desenvolupat per Nomic AI, va ser ajustat a partir del model LLaMA i entrenat en un corpus curat d'interaccions d'assistents, incloent-hi codi, històries, descripcions i diàleg de múltiples torns. GPT4All és un ecosistema de programari de codi obert que permet a qualsevol entrenar i desplegar models de llenguatge grans i potents en maquinari quotidià.

OpenAssistant

OpenAssistant és un projecte llançat fa només un mes per Large-scale Artificial Intelligence Open Network (LAION) i més de 13,000 voluntaris a tot el món. El seu objectiu és democratitzar la IA generativa i prevenir que les grans corporacions monopolitzin el mercat de models de llenguatge. Planegen fer de codi obert tots els seus models, conjunts de dades i el procés de recopilació de dades completament transparent.

gestion_documental_ocr_pymes

Consideracions finals

El principal problema amb les alternatives de codi obert a ChatGPT i els models base de GPT és que es desenvolupen principalment com a projectes de recerca. Estan destinats a investigadors, acadèmics i aficionats en processament de llenguatge natural, aprenentatge automàtic i intel·ligència artificial i no a usuaris comercials. Tot i que aquests models contribueixen al desenvolupament del camp de la IA generativa, el nombre d'alternatives de codi obert que es poden utilitzar comercialment és limitat i no inclou els models més potents.

No obstant això, els beneficis d'utilitzar models de codi obert poden superar el rendiment més baix en alguns casos. Aquests models poden ser desenvolupats i ajustats dins de les organitzacions per assolir bons resultats en casos dús específics. LLaMA, desenvolupat per Meta, és un dels models de codi obert més destacats. Tot i que els seus paràmetres poden no semblar tan impressionants com els de GPT-4 o GPT-3, no cal subestimar-ho. Tot i tenir menys paràmetres, els models LLaMA van ser entrenats amb un nombre més gran de tokens, la qual cosa significa que són més fàcils de reentrenar i ajustar per a casos d'ús específics. Com a resultat, LLaMA-13B supera GPT-3 en les tasques de raonament de sentit comú.

Conclusió

En conclusió, encara que les alternatives de codi obert a GPT poden no ser tan potents com els models d'OpenAI, ofereixen una sèrie d'avantatges que els poden fer atractius per a certs usuaris i empreses. Tot i això, és important tenir en compte que l'adopció de la IA generativa no està exempta de desafiaments i pors, i que l'elecció del model correcte dependrà de les necessitats i prioritats específiques de cada usuari o empresa.

Els nostres partners en seguretat i tecnologia

ca