5. Modul · Alapok
A bemenet minősége dönt
A nyelvi modellek nem emberként olvasnak: tokenizálnak, mintázatot keresnek, és a bemenet nyelve valamint formátuma közvetlenül befolyásolja a pontosságot, a figyelmet és a költséget. Sok drága hiba nem a rossz instrukcióból, hanem a rosszul strukturált adatbevitelből jön.
Nem csak az számít, mit kérsz
A legtöbb ember úgy gondol a promptolásra, mintha csak az instrukció minősége számítana. Ez csak félig igaz. A modell teljesítményét legalább három dolog együtt határozza meg: milyen feladatot adsz neki, milyen nyelven dolgozik, és milyen formában kapja meg az adatot.
Ugyanaz a kérés teljesen más eredményt adhat attól függően, hogy magyarul vagy angolul kell logikáznia, nyers PDF-ből vagy tiszta Markdownból dolgozik, illetve strukturált táblázatot vagy ömlesztett szöveget kap bemenetként.
Ez a modul nem „formátum-ismeret", hanem minőség-optimalizálás — arról szól, hogyan adjuk át az adatot úgy, hogy a modell a lehető legkevesebb zajjal dolgozhasson.
Milyen sorrendben dönts?
Amikor AI-nak adsz inputot, érdemes mindig ugyanabban a sorrendben gondolkodni — így a döntések egymásra épülnek, nem egymást keresztezik.
Mi a feladat típusa?
Összefoglalás, elemzés, osztályozás, kódolás, fordítás, kutatás, döntéstámogatás? A feladat típusa meghatározza, milyen bemenetre van szükség.
Milyen nyelven érdemes dolgoznia?
A végső választ magyarul kéred, vagy a belső feldolgozás is maradhat angol? Ez nem mindegy — a két dolog szétválasztható.
Milyen formátumban add át az anyagot?
Nyers PDF, tisztított Markdown, JSON, CSV, XML, YAML? A formátum nem esztétikai kérdés: a modell ebből is „olvas".
Mi a legkisebb zajjal járó bemenet?
A modell nem varázslattal érti meg az anyagot. Minél tisztább a szerkezet, annál kisebb az összecsúszás esélye.
A jó döntés nem az, hogy mindig ugyanazt a formátumot használod, hanem az, hogy a feladathoz legjobban illeszkedő inputot választod.
Természetes nyelvek
Az angol gyakran precízebb, a magyar gyakran drágább.
Angol előny
A modellek képzési adatainak nagy része angol, ezért komplex logikai feladatoknál — technikai, jogi, kódolási — az angol gyakran stabilabb és következetesebb.
Magyar felár
A magyar agglutináló nyelv, így egy szó több tokenre bomolhat. Ez növeli a költséget és gyorsabban terheli a kontextusablakot.
Gyakorlati tipp – hibrid workflow
Hosszú magyar dokumentumnál kérd, hogy az elemzés és hibakeresés angolul történjen, a végső összefoglaló pedig magyarul.
Mikor NE válts angol reasoningre?
Az angol gyakran jobb logikai munkanyelv, de nem minden helyzetben ez a jó döntés. Ne erőltesd az angol reasoninget, ha a forrásnyelv nagyon árnyalt jogi vagy kulturális magyar szöveg, ha a pontos terminológia kritikus, ha a végső outputot szóhasználati pontossággal kell visszaadni, vagy ha a feladat inkább interpretáció, mint tiszta logikai feldolgozás.
Ilyenkor jobb lehet teljesen magyarul dolgozni, vagy kétlépcsős megoldást használni: először rögzítsd a magyar kulcsfogalmakat és terminusokat, utána csak az elemzési logika váltson angolra. A fő szabály: nem az angol a cél, hanem a stabilabb reasoning. Ha a nyelvváltás torzítja a jelentést, többet vesztesz, mint nyersz.
Programozási nyelvek
Az AI sok nyelven ír kódot, de nem mindegyikben egyformán erős.
A training adatokban rengeteg forráskód van, ezért az AI természetesen otthon van a kódban. A Python és a JavaScript/TypeScript általában a legstabilabb választás, ha megbízható kimenetet szeretnél.
Ha nem vagy fejlesztő, és belső automatizációs scriptet kérsz, általában kérd Pythonban. Egyszerűbb, kevesebb a platformfüggő rész, és könnyebb hibakeresni.
Mi tesz egy formátumot jó inputtá?
Nem az a kérdés, hogy „modern" vagy „technikai" egy formátum, hanem az, hogy a modell számára mennyi zajt és mennyi szerkezetet hordoz. Egy jó inputformátum jól elválasztja az egységeket, kevés fölösleges szintaktikai zajt visz be, embernek is olvasható, és könnyen újrafelhasználható.
A cél nem a „legtechnikásabb" forma, hanem a legkisebb zajjal járó, legjobban követhető struktúra.
Formátumok harca
Markdown vs JSON vs nyers PDF/Word – hol nyer a pontosság?
A formátum nem díszítés: a modell ebből is olvas. A jó struktúra segíti a figyelmet, a rossz strukturálás viszont zajt visz a kontextusba. Chat-alapú munkában a Markdown gyakran a legjobb alapértelmezett.
Markdown
Tiszta tagolás, fejlécek és listák. Embernek olvasható, modelleknek jól követhető.
JSON (chatben)
Sok szintaktikai zaj, nehezebb szemmel követni. Később viszont hasznos automatizálásnál és API-knál.
Nyers PDF / Word
Láthatatlan formázási törmelék, széteső táblázatok. Érdemes előbb tisztítani, majd Markdownra váltani.
JSON — chatben zajos
{
"employees": [
{
"name": "Kovács Péter",
"dept": "Marketing",
"salary": 850000
}
]
}Markdown — chatben tisztább
| Név | Osztály | Fizetés | |--------------|-----------|-----------| | Kovács Péter | Marketing | 850 000 | | Nagy Anna | IT | 1 200 000 |
Gyakorlati tipp 1
Ha ###, ** és - jeleket látsz, az nem hiba — ez a Markdown struktúra része.
Gyakorlati tipp 2
Tudásbázis vagy projektmemória feltöltésénél a tiszta Markdown sokszor jobb kiindulópont, mint a tördelt PDF vagy DOCX.
XML és YAML
Strukturált promptolás: az utasítás és az adat szétválasztása.
Ha egy hosszú promptba csak beömleszted az utasításokat és az adatokat, a modell könnyen összekeveri, mi a szabály és mi a nyers tartalom. A strukturált jelölés segíti a szétválasztást — de önmagában nem garancia a biztonságra.
XML
Az XML tagek (pl. <context>, <task>, <data>) éles határt adnak, így csökken az összekeverés kockázata és javul a kontroll. Nem védelmi fal, de erős struktúra.
YAML
Behúzásos, hierarchikus szabályrendszerekhez és konfigurációkhoz ideális. Jól olvasható, kevés szintaktikai zaj, könnyen szerkeszthető.
XML-t használj
Ha hosszú dokumentumot, interjút vagy hírlevelet illesztesz a promptba, és fontos, hogy az adat és az instrukció élesen elváljon.
YAML-t használj
Ha szabályrendszert, agent viselkedést vagy konfigurációt írsz le, és az olvashatóság fontosabb, mint a szigorú gépi validálhatóság.
Multimodalitás
Nem minden bemenet egyformán megbízható.
A modell többféle inputtípust is tud kezelni, de ezek nem azonos pontosságúak és nem azonos kontrollszintűek. Érdemes megbízhatósági sorrendként gondolni rájuk, nem puszta funkciólistáként.
Tiszta szöveg
A legjobban kontrollálható, legkönnyebben strukturálható, és általában ez adja a legstabilabb outputot. Ha átrakhatod ide az adatot, csináld meg.
Strukturált táblázatos adat
CSV, jól szervezett Excel-export — erős elemzéshez és összehasonlításhoz, ha az adatminőség rendben van.
Kép és PDF
Használható, de nagyobb a félreolvasás, formátumvesztés és táblázat-törés kockázata. Előbb érdemes tisztítani, ha lehetséges.
Hang és videó
Ritkán érdemes közvetlenül elemeztetni. Előbb készíts transcriptet, utána dolgozz strukturált szöveggel — pontosabb és olcsóbb eredményt kapsz.
Szöveg
Natív – ez az AI fő területe. Markdown, TXT, kód.
KiválóKép
Multimodális modellek (GPT-5.4, Gemini 3.1, Claude Opus 4.6) értik és elemzik.
JóFeldolgozza, de a formázás elveszhet. Jobb: konvertáld Markdown-ra (Marker, MinerU).
KözepesCSV / Excel
Táblázatos adatokat jól elemez. Excelből CSV-t csinálj a feltöltés előtt.
JóKód
Natív – olvas, ír, javít, refaktorál. Python és JS a legjobb.
KiválóHang / Videó
Whisper (OpenAI) átírja szöveggé, utána az LLM feldolgozza.
KözvetettGyakorlati szabály: ha ugyanazt az információt át tudod alakítani tiszta szöveggé vagy strukturált adattá, általában jobb eredményt kapsz, mint nyers multimodális inputból.
Mikor mit használj?
Gyors döntéstámogatás nyelvhez, formátumhoz és bemenethez.
| Nyelv | AI tudás |
|---|---|
| 🐍Python | Natív |
| 📜JavaScript / TypeScript | Natív |
| 🗄️SQL | Natív |
| 🌐HTML / CSS | Natív |
| ☕Java | Erős |
| 🔷C# / .NET | Erős |
| ⚡C / C++ | Erős |
| 🦀Rust | Jó |
| 🔵Go | Jó |
| 🐘PHP | Jó |
| 💎Ruby | Megfelelő |
| 📊R | Jó |
| 🖥️Shell / Bash | Jó |
| 🍎Swift | Megfelelő |
| 🤖Kotlin | Megfelelő |
Gyakorlás
Teszteld magad AI-jal
A jó inputformátum kiválasztása ugyanúgy készség, mint maga a promptírás. Ezt akkor érted, ha külön tudsz dönteni nyelvről, formátumról és tisztítási lépésről.
Kérdezd meg az AI-t
- →Egy hosszú magyar PDF-ből mikor érdemes előbb tiszta Markdownot vagy transcriptet készíteni, és miért?
- →Mikor indokolt JSON, és mikor jobb inkább Markdownot, XML-t vagy YAML-t használni?
Kész prompt
“Adj nekem 2 rövid AI-input helyzetet, és kérd meg, hogy válasszam ki a legjobb nyelvet és formátumot. A válaszom után indokold meg röviden, miért az a jobb döntés.”
Zárás: a jó input nem mellékes részlet
A struktúra maga a minőség.
A prompt minősége fontos, de a modell teljesítménye nem csak attól függ, hogyan fogalmazol. Attól is függ, milyen nyelven gondolkodik, milyen formátumban kapja az adatot, és mennyi zajjal kell megküzdenie.
Ha fontos a logikai stabilitás, gondolkodj a munkanyelven. Ha fontos a kontroll, tisztítsd és strukturáld az inputot. Ha fontos a pontosság, csökkentsd a fölösleges formátumzajt. Ha fontos az újrahasználhatóság, válassz címkézett vagy szabályozott szerkezetet.