VYSVETLENIE! Tie NAJZNÁMEJŠIE Pojmy AI: AGI, Halucinovanie AI, LLM, Gan, WEIGHTs a ďalšie...

26.05.2025

Jasný Sprievodca Bežnými Pojmami v AI: Od LLM po Halucinácie

Svet umelej inteligencie je rozsiahly a zložitý, plný žargónu a špecializovanej terminológie, ktorú často používajú vedci a odborníci v tejto oblasti. Vzhľadom na to, že sa technické výrazy čoraz častejšie objavujú v správach a článkoch o AI, pripravili sme tento jednoduchý slovník, ktorý vám pomôže lepšie sa zorientovať v kľúčových pojmoch. Tento sprievodca sa bude pravidelne aktualizovať s objavovaním nových metód a bezpečnostných rizík v oblasti umelej inteligencie.

AGI (Umelá všeobecná inteligencia)

AGI je nejasný pojem, ktorý sa však všeobecne vzťahuje na AI, ktorá je schopnejšia ako priemerný človek vo väčšine, ak nie vo všetkých úlohách. Generálny riaditeľ spoločnosti OpenAI, Sam Altman, nedávno opísal AGI ako "ekvivalent priemerného človeka, ktorého by ste si mohli najať ako spolupracovníka". Chartu OpenAI definuje AGI ako "vysoko autonómne systémy, ktoré prekonávajú ľudí vo väčšine ekonomicky hodnotnej práce". Pochopenie spoločnosti Google DeepMind sa mierne líši, vnímajú AGI ako "AI, ktorá je prinajmenšom taká schopná ako ľudia vo väčšine kognitívnych úloh". Aj napriek týmto definíciám sú aj samotní experti v popredí výskumu AI často zmätení z presného vymedzenia AGI.

AI agent

AI agent je nástroj, ktorý využíva technológie AI na vykonávanie série úloh vo vašom mene – nad rámec toho, čo by dokázal jednoduchší chatbot. Môže to zahŕňať podávanie výdavkov, rezerváciu lístkov alebo stola v reštaurácii, alebo dokonca písanie a údržbu kódu. Tento emergentný priestor je stále vo vývoji, a tak sa "AI agent" môže pre rôznych ľudí líšiť. Základný koncept však naznačuje autonómny systém, ktorý môže využívať viacero systémov AI na vykonávanie viacstupňových úloh.

Reťaz myslenia (Chain of Thought)

V kontexte AI znamená reťaz myslenia pre veľké jazykové modely (LLM) rozdelenie problému na menšie, medzistupňové kroky s cieľom zlepšiť kvalitu konečného výsledku. Zvyčajne trvá dlhšie, kým sa získa odpoveď, ale odpoveď je pravdepodobnejšie správna, najmä v logickom alebo kódovacom kontexte. Modely uvažovania sú vyvinuté z tradičných veľkých jazykových modelov a optimalizované pre myslenie typu "reťazca myslenia" vďaka posilňovaciemu učeniu.

Hlboké učenie (Deep Learning)

Hlboké učenie je podmnožinou samo-zlepšujúceho sa strojového učenia, v ktorom sú algoritmy AI navrhnuté s viacvrstvovou umelou neurónovou sieťou (ANN). To im umožňuje vytvárať zložitejšie korelácie v porovnaní s jednoduchšími systémami založenými na strojovom učení. Štruktúra algoritmov hlbokého učenia čerpá inšpiráciu z prepojených ciest neurónov v ľudskom mozgu. Modely hlbokého učenia sú schopné samy identifikovať dôležité charakteristiky v dátach bez toho, aby vyžadovali, aby ľudskí inžinieri tieto vlastnosti definovali. Hoci si vyžadujú veľké množstvo dátových bodov (milióny alebo viac) a sú nákladnejšie na trénovanie.

Difúzia (Diffusion)

Difúzia je technológia, ktorá je základom mnohých modelov AI generujúcich umenie, hudbu a text. Inšpirovaná fyzikou, difúzne systémy pomaly "ničia" štruktúru dát (napr. fotografie, piesne) pridávaním šumu, kým nezostane nič. V AI systémy difúzie sa snažia naučiť proces "reverznej difúzie", aby obnovili zničené dáta, čím získajú schopnosť obnoviť dáta zo šumu.

Destilácia (Distillation)

Destilácia je technika používaná na extrakciu vedomostí z veľkého modelu AI pomocou modelu "učiteľ-žiak". Vývojári posielajú požiadavky učiteľskému modelu a zaznamenávajú výstupy. Tieto výstupy sa potom používajú na trénovanie žiackeho modelu, ktorý je trénovaný tak, aby sa približoval správaniu učiteľa. Destilácia môže byť použitá na vytvorenie menšieho, efektívnejšieho modelu založeného na väčšom modeli s minimálnou stratou destilácie.

Dolaďovanie (Fine-tuning)

Dolaďovanie sa vzťahuje na ďalšie trénovanie modelu AI s cieľom optimalizovať výkon pre špecifickejšiu úlohu alebo oblasť, než bola predtým ústredným bodom jeho tréningu – zvyčajne sa to dosiahne zadávaním nových, špecializovaných dát. Mnohé startupy v oblasti AI používajú veľké jazykové modely ako východiskový bod pre vývoj komerčného produktu, ale snažia sa zvýšiť ich užitočnosť pre cieľové odvetvie alebo úlohu doplnením skorších tréningových cyklov dolaďovaním založeným na ich vlastných špecifických znalostiach a odbornosti.

GAN (Generative Adversarial Network)

GAN, alebo Generatívna Adversariálna Sieť, je typ rámca strojového učenia, ktorý je základom niektorých dôležitých pokrokov v generatívnej AI, pokiaľ ide o produkciu realistických dát – vrátane (ale nielen) nástrojov na vytváranie deepfake. GAN zahŕňa použitie dvojice neurónových sietí, z ktorých jedna čerpá zo svojich tréningových dát na generovanie výstupu, ktorý sa prenáša na druhý model na vyhodnotenie. Tento druhý, diskriminátorový model tak hrá úlohu klasifikátora výstupu generátora – čo mu umožňuje zlepšovať sa v priebehu času.

Halucinácia (Hallucination)

Halucinácia je preferovaný termín v odvetví AI pre modely AI, ktoré si "niečo vymýšľajú" – doslova generujú nesprávne informácie. Je to obrovský problém pre kvalitu AI. Halucinácie produkujú výstupy generatívnej AI, ktoré môžu byť zavádzajúce a dokonca viesť k rizikám v reálnom živote – s potenciálne nebezpečnými následkami (predstavte si zdravotnú otázku, ktorá vráti škodlivé lekárske rady). Predpokladá sa, že problém s AI, ktorá si vymýšľa informácie, vzniká v dôsledku medzier v tréningových dátach. To prispieva k tlaku na čoraz špecializovanejšie a/alebo vertikálne modely AI – t.j. AI špecifické pre doménu, ktoré vyžadujú užšiu odbornosť – ako spôsob zníženia pravdepodobnosti medzier v znalostiach a zmenšenia rizík dezinformácií.

Inferencie (Inference)

Inferencie sú procesom spustenia modelu AI. Je to nastavenie modelu tak, aby robil predpovede alebo vyvodzoval závery z predtým videných dát. Inferencie sa nemôžu uskutočniť bez tréningu; model sa musí naučiť vzory v súbore dát, aby mohol efektívne extrapolovať z týchto tréningových dát. Mnoho typov hardvéru môže vykonávať inferencie, od procesorov smartfónov po výkonné GPU a špeciálne navrhnuté AI akcelerátory.

Veľký jazykový model (Large Language Model - LLM)

Veľké jazykové modely, alebo LLM, sú modely AI používané populárnymi asistentmi AI, ako sú ChatGPT, Claude, Google Gemini, Meta AI Llama, Microsoft Copilot alebo Mistral Le Chat. Keď chatujete s asistentom AI, interagujete s veľkým jazykovým modelom, ktorý spracováva vašu požiadavku priamo alebo s pomocou rôznych dostupných nástrojov, ako je prehliadanie webu alebo interprety kódu. LLM sú hlboké neurónové siete zložené z miliárd numerických parametrov (alebo váh), ktoré sa učia vzťahy medzi slovami a frázami a vytvárajú reprezentáciu jazyka, akúsi viacrozmernú mapu slov. Tieto modely sú vytvorené kódovaním vzorov, ktoré nájdu v miliardách kníh, článkov a prepisov.

Neurónová sieť (Neural Network)

Neurónová sieť sa vzťahuje na viacvrstvovú algoritmickú štruktúru, ktorá je základom hlbokého učenia – a širšie aj celého boomu v generatívnych nástrojoch AI po vzniku veľkých jazykových modelov. Hoci myšlienka inšpirovať sa husto prepojenými cestami ľudského mozgu ako návrhovou štruktúrou pre algoritmy spracovania dát siaha až do 40. rokov 20. storočia, bol to oveľa nedávnejší vzostup hardvéru na spracovanie grafiky (GPU) – prostredníctvom odvetvia videohier – ktorý skutočne odomkol silu tejto teórie.

Tréning (Training)

Vývoj AI strojového učenia zahŕňa proces známy ako tréning. Jednoducho povedané, ide o zadávanie dát s cieľom, aby sa model mohol učiť zo vzorov a generovať užitočné výstupy. Je dôležité poznamenať, že nie každá AI vyžaduje tréning. AI založené na pravidlách, ktoré sú naprogramované tak, aby sa riadili ručne preddefinovanými inštrukciami – napríklad lineárne chatboty – nemusia prejsť tréningom. Avšak takéto systémy AI budú pravdepodobne obmedzenejšie ako (dobre trénované) samo-učiace sa systémy. Tréning môže byť drahý, pretože si vyžaduje veľa vstupov – a objem vstupov potrebných pre takéto modely má tendenciu stúpať.

Prenosové učenie (Transfer Learning)

Technika, pri ktorej sa predtým trénovaný model AI používa ako východiskový bod pre vývoj nového modelu pre inú, ale typicky súvisiacu úlohu – čo umožňuje opätovné použitie vedomostí získaných v predchádzajúcich tréningových cykloch. Prenosové učenie môže priniesť úspory efektívnosti skrátením vývoja modelu. Môže byť tiež užitočné, keď sú dáta pre úlohu, pre ktorú sa model vyvíja, do určitej miery obmedzené. Je však dôležité poznamenať, že tento prístup má obmedzenia.

Váhy (Weights)

Váhy sú jadrom tréningu AI, pretože určujú, aká dôležitosť (alebo váha) sa pripisuje rôznym vlastnostiam (alebo vstupným premenným) v dátach použitých na tréning systému – čím sa formuje výstup modelu AI. Inak povedané, váhy sú numerické parametre, ktoré definujú, čo je najdôležitejšie v dátovom súbore pre danú tréningovú úlohu. Svoju funkciu dosahujú aplikovaním násobenia na vstupy. Tréning modelu typicky začína náhodne priradenými váhami, ale ako sa proces odvíja, váhy sa prispôsobujú, keď sa model snaží dosiahnuť výstup, ktorý sa viac zhoduje s cieľom.