GPTren kode irekiko alternatibak: benetan lehiatu al daitezke?

_codigoabierto_gpt_Extraction OCR IA fakturak bidaltzeko albaranak - ikasketa automatikoa adimen artifizialeko kontabilitate softwarearekin AI OCR Dijit.app entrega-alharen fakturak datuak erauzteko fakturak eta albaranak automatizatzen ditu OCR IA Dijit.app

Ireki AI oso ezaguna da Adimen Artifizial Sortzailearen arloan, baina ez da jokoko jokalari bakarra. GPT-ren kode irekiko alternatibak daude, antzeko errendimendua, gardentasun handiagoa eta konputazio-potentzia eskakizun txikiagoak eskaintzen dituztenak. Alternatiba hauek erakargarriak dira beren datuen pribatutasuna baloratzen duten eta prestakuntza-prozesuaren kontrol handiagoa nahi duten erabiltzaileentzat. Baina benetan lehiatu al daitezke OpenAI ereduekin?

Erronkak eta beldurrak IA sortzailea hartzean

AI generatiboa urteko joera teknologikoa da, arreta, inbertsio eta finantzaketa handiak erakartzen dituena. Hala ere, bere onarpena ez dago kezka eta ziurgabetasunik gabe. Eraginkortasuna eta kostuen aurrezpena bezalako abantaila handiak eskaintzen dituen arren, datuen urraketen, AI sortzaileen enpresen aurkako auziak eta ChatGPT bezalako tresnen debekuak ere badaude datuen segurtasun kezkak direla eta.

Iturburu irekia izan al daiteke irtenbidea?

Kode irekia izan daiteke erronka eta beldur hauen irtenbidea. Artikulu honetan, ChatGPT eta oinarrizko GPT ereduen alternatibak aztertuko ditugu. Digital Ocean-en azken txosten batek erakusten du startup eta ETEen 30% baino gehiagok eta korporazioen 28%k kode irekiko irtenbideak aukeratzen dituztela beren softwarearen erdirako. Gainera, inkestatutako enpresen 80%-ek gora egiten ari diren teknologietarako balio horiek handitzea espero dute. Dagoeneko kode irekiaren aldeko apustua egin dutenentzat, segurtasun estrategiaren funtsezko atal bat da.

Malgutasuna eta pertsonalizazioa

Bigarren arrazoia, 79%-k bere enpresetan kode irekiko soluzioak erabiltzen dituztenen esanetan, kode irekiak malgutasuna ematen duela konponbideak pertsonalizatzeko beharrizan eta enpresa estandar zehatzei erantzuteko. AI sortzailearen kasuan, bereziki garrantzitsua da prestakuntza prozesua kontrolatzea eta balizko alborapenak ulertzea.

GPTren alternatiba ezagunak

Deiak

LLaMA, Meta-ren AI ikerketa-laborategian garatua, kode irekiko eredu garrantzitsuenetako bat da. Bere parametroak GPT-4 edo GPT-3-renekin alderatuta ez direla ikusgarriak diruditen arren, ez da gutxietsi behar. Parametro gutxiago izan arren, LLaMA ereduak token kopuru handiagoarekin entrenatu ziren, hau da, errazagoak dira birmoldatzen eta sintonizatzen erabilera kasu zehatzetarako. Ondorioz, LLaMA-13B-k GPT-3 gainditzen du zentzu arrunteko arrazoiketa lanetan. Hala ere, LLaMArako sarbidea ikertzaile akademikoei, gobernuari lotutako erakundeei, gizarte zibilari eta ikerketa-laborategiei mugatuta dago kasuan-kasuan.

AUKERATU

Open Pretrained Transformer (OPT) hizkuntza-ereduak, Metak 2022ko maiatzean kaleratutakoa, 175B parametro ditu (GPT-3 bezalakoak) eta datu-multzo publiko anitzetan trebatu zen. Zoritxarrez, LLaMA bezala, gaur egun OPT eskuragarri dago ikerketa helburuetarako soilik merkataritza ez den lizentzia batekin.

MPT-7B

MPT-7B MosaicML-k garatutako MosaicPretrainedTransformer (MPT) ereduen parte da. Ingelesezko testu eta kode-token 1T-n trebatu zen; Prestakuntza eta inferentzia eraginkorretarako optimizatuta dagoela esaten da eta, aitortu behar dugu, oso itxaropentsua dirudi GPTren kode irekiko alternatiba gisa.

GPT-J eta GPT-NeoX

GPT-J eta GPT-NeoX EleutherAIk garatutako testuak sortzeko ereduak dira. Tamaina txikiagoak izan arren, eredu hauek OpenAIren Babbage eta Curie modeloen (GPT-3 familia) errendimendu ia berdina eskaintzen dute hizkuntza estandarreko modelatze-zereginetan. Onena, eredu hauek guztiz doakoak dira eta erabilera komertziala ahalbidetzen dute.

Dolly

Dolly kode irekiko beste hizkuntza-eredu bat da, txat-botetan, testuen laburpenean eta oinarrizko bilatzaileetan erabil daitekeena. Garrantzitsua da ikerketarako eta erabilera komertzialerako lizentzia duela.

dokumentu_kudeaketa_ocr_pymes

ChatGPT moduko txat-botak AI sorkuntzazko ereduekin eraikiak

Alpaka

Alpacak, Stanford Unibertsitatean ikerketa-proiektu gisa garatua, haluzinazioen eta alborapenen gero eta arazoari aurre egiten dio AI eredu sortzaileetan. Hala ere, haren erabilera ikerketa akademikora mugatzen da eta erabilera komertziala debekatuta dago.

Bikuña

Vicuna, UC Berkeley, CMU, Stanford eta UC San Diego-ko taldeak garatutakoa, LLaMA afinatuz trebatu zen ShareGPT-tik API publikoekin bildutako erabiltzaileek partekatutako 70.000 elkarrizketetan. ChatGPT baino parametro gutxiago erabiltzen baditu ere (13B 175B-rekin alderatuta), Vicuna "90%-ren ChatGPT kalitatearekin GPT-4 kode irekiko txat-bot gisa aurkeztu zen" eta egindako probetan ondo aritu zen.

GPT4All

GPT4All, Nomic AI-k garatutakoa, LLaMA eredutik finkatu zen eta parte-hartzaileen interakzioen corpus zaindu batean trebatu zen, kodea, istorioak, deskribapenak eta txanda anitzeko elkarrizketa barne. GPT4All kode irekiko software ekosistema bat da, edonori hizkuntza-eredu handiak eta indartsuak eguneroko hardwarean trebatzeko eta zabaltzeko aukera ematen diona.

OpenAssistant

OpenAssistant duela hilabete eskala Handiko Adimen Artifizialaren Sare Irekiak (LAION) eta mundu osoko 13.000 boluntario baino gehiagok abian jarritako proiektua da. Bere helburua da AI sortzailea demokratizatzea eta korporazio handiek hizkuntza ereduen merkatua monopolizatzea ekiditea. Euren eredu, datu-multzo eta datu-bilketa prozesua guztiz gardenak iturburu irekitzeko asmoa dute.

dokumentu_kudeaketa_ocr_pymes

Azken gogoetak

ChatGPT eta GPT oinarrizko ereduen kode irekiko alternatiben arazo nagusia ikerketa-proiektu gisa garatzen direla da. Hizkuntza naturalaren prozesamenduan, ikaskuntza automatikoan eta adimen artifizialean ikertzaile, akademiko eta zaletuentzat daude pentsatuta, eta ez erabiltzaile komertzialei. Eredu hauek AI sortzailearen eremua garatzen laguntzen badute ere, komertzialki erabil daitezkeen kode irekiko alternatiba kopurua mugatua da eta ez ditu eredurik indartsuenak barne hartzen.

Hala ere, kode irekiko ereduak erabiltzearen onurak haien errendimendu txikiagoa baino handiagoa izan daiteke kasu batzuetan. Eredu hauek erakundeen barruan garatu eta egokitu daitezke erabilera kasu zehatzetan emaitza onak lortzeko. Metak garatutako LLaMA, kode irekiko eredu nabarmenetako bat da. Bere parametroak GPT-4 edo GPT-3-renak bezain ikusgarriak ez diruditen arren, ez da gutxietsi behar. Parametro gutxiago izan arren, LLaMA ereduak token kopuru handiagoarekin entrenatu ziren, hau da, errazagoak dira birmoldatzen eta sintonizatzen erabilera kasu zehatzetarako. Ondorioz, LLaMA-13B-k GPT-3 gainditzen du zentzu arrunteko arrazoiketa lanetan.

Ondorioa

Ondorioz, GPTren kode irekiko alternatibak OpenAI ereduak bezain indartsuak ez badira ere, erabiltzaile eta enpresa batzuentzat erakargarriak izan daitezkeen hainbat abantaila eskaintzen dituzte. Hala ere, kontuan izan behar da AI sortzailea hartzea ez dela erronka eta beldurrik gabea, eta eredu egokia aukeratzea erabiltzaile edo enpresa bakoitzaren behar eta lehentasun zehatzen araberakoa izango dela.

Gure bazkideak segurtasun eta teknologian

eu