5. Modul · Alapok

A bemenet minősége dönt

A nyelvi modellek nem emberként olvasnak: tokenizálnak, mintázatot keresnek, és a bemenet nyelve valamint formátuma közvetlenül befolyásolja a pontosságot, a figyelmet és a költséget. Sok drága hiba nem a rossz instrukcióból, hanem a rosszul strukturált adatbevitelből jön.

Nem csak az számít, mit kérsz

A legtöbb ember úgy gondol a promptolásra, mintha csak az instrukció minősége számítana. Ez csak félig igaz. A modell teljesítményét legalább három dolog együtt határozza meg: milyen feladatot adsz neki, milyen nyelven dolgozik, és milyen formában kapja meg az adatot.

Ugyanaz a kérés teljesen más eredményt adhat attól függően, hogy magyarul vagy angolul kell logikáznia, nyers PDF-ből vagy tiszta Markdownból dolgozik, illetve strukturált táblázatot vagy ömlesztett szöveget kap bemenetként.

Ez a modul nem „formátum-ismeret", hanem minőség-optimalizálás — arról szól, hogyan adjuk át az adatot úgy, hogy a modell a lehető legkevesebb zajjal dolgozhasson.

Milyen sorrendben dönts?

Amikor AI-nak adsz inputot, érdemes mindig ugyanabban a sorrendben gondolkodni — így a döntések egymásra épülnek, nem egymást keresztezik.

1

Mi a feladat típusa?

Összefoglalás, elemzés, osztályozás, kódolás, fordítás, kutatás, döntéstámogatás? A feladat típusa meghatározza, milyen bemenetre van szükség.

2

Milyen nyelven érdemes dolgoznia?

A végső választ magyarul kéred, vagy a belső feldolgozás is maradhat angol? Ez nem mindegy — a két dolog szétválasztható.

3

Milyen formátumban add át az anyagot?

Nyers PDF, tisztított Markdown, JSON, CSV, XML, YAML? A formátum nem esztétikai kérdés: a modell ebből is „olvas".

4

Mi a legkisebb zajjal járó bemenet?

A modell nem varázslattal érti meg az anyagot. Minél tisztább a szerkezet, annál kisebb az összecsúszás esélye.

A jó döntés nem az, hogy mindig ugyanazt a formátumot használod, hanem az, hogy a feladathoz legjobban illeszkedő inputot választod.

Természetes nyelvek

Az angol gyakran precízebb, a magyar gyakran drágább.

Angol előny

A modellek képzési adatainak nagy része angol, ezért komplex logikai feladatoknál — technikai, jogi, kódolási — az angol gyakran stabilabb és következetesebb.

Magyar felár

A magyar agglutináló nyelv, így egy szó több tokenre bomolhat. Ez növeli a költséget és gyorsabban terheli a kontextusablakot.

Gyakorlati tipp – hibrid workflow

Hosszú magyar dokumentumnál kérd, hogy az elemzés és hibakeresés angolul történjen, a végső összefoglaló pedig magyarul.

„Olvasd el az alábbi magyar szöveget. Az elemzést és a logikai dedukciót végezd angolul, majd a végső vezetői összefoglalót fordítsd le és add vissza magyarul."

Mikor NE válts angol reasoningre?

Az angol gyakran jobb logikai munkanyelv, de nem minden helyzetben ez a jó döntés. Ne erőltesd az angol reasoninget, ha a forrásnyelv nagyon árnyalt jogi vagy kulturális magyar szöveg, ha a pontos terminológia kritikus, ha a végső outputot szóhasználati pontossággal kell visszaadni, vagy ha a feladat inkább interpretáció, mint tiszta logikai feldolgozás.

Ilyenkor jobb lehet teljesen magyarul dolgozni, vagy kétlépcsős megoldást használni: először rögzítsd a magyar kulcsfogalmakat és terminusokat, utána csak az elemzési logika váltson angolra. A fő szabály: nem az angol a cél, hanem a stabilabb reasoning. Ha a nyelvváltás torzítja a jelentést, többet vesztesz, mint nyersz.

Programozási nyelvek

Az AI sok nyelven ír kódot, de nem mindegyikben egyformán erős.

A training adatokban rengeteg forráskód van, ezért az AI természetesen otthon van a kódban. A Python és a JavaScript/TypeScript általában a legstabilabb választás, ha megbízható kimenetet szeretnél.

Ha nem vagy fejlesztő, és belső automatizációs scriptet kérsz, általában kérd Pythonban. Egyszerűbb, kevesebb a platformfüggő rész, és könnyebb hibakeresni.

⚠️Fontos: Az AI által generált kódot mindig ellenőrizd futtatás előtt! Különösen igaz ez C/C++ és Rust esetén, ahol a memóriakezelési hibák súlyos biztonsági kockázatot jelenthetnek.

Mi tesz egy formátumot jó inputtá?

Nem az a kérdés, hogy „modern" vagy „technikai" egy formátum, hanem az, hogy a modell számára mennyi zajt és mennyi szerkezetet hordoz. Egy jó inputformátum jól elválasztja az egységeket, kevés fölösleges szintaktikai zajt visz be, embernek is olvasható, és könnyen újrafelhasználható.

Tiszta, strukturált szöveglegjobb
Strukturált táblázatos adaterős
Címkézett hierarchikus prompt (XML/YAML)
Nyers, formázási törmelékes dokumentumkerülendő

A cél nem a „legtechnikásabb" forma, hanem a legkisebb zajjal járó, legjobban követhető struktúra.

Formátumok harca

Markdown vs JSON vs nyers PDF/Word – hol nyer a pontosság?

A formátum nem díszítés: a modell ebből is olvas. A jó struktúra segíti a figyelmet, a rossz strukturálás viszont zajt visz a kontextusba. Chat-alapú munkában a Markdown gyakran a legjobb alapértelmezett.

Markdown

Tiszta tagolás, fejlécek és listák. Embernek olvasható, modelleknek jól követhető.

JSON (chatben)

Sok szintaktikai zaj, nehezebb szemmel követni. Később viszont hasznos automatizálásnál és API-knál.

Nyers PDF / Word

Láthatatlan formázási törmelék, széteső táblázatok. Érdemes előbb tisztítani, majd Markdownra váltani.

JSON — chatben zajos

{
  "employees": [
    {
      "name": "Kovács Péter",
      "dept": "Marketing",
      "salary": 850000
    }
  ]
}

Markdown — chatben tisztább

| Név          | Osztály   | Fizetés   |
|--------------|-----------|-----------|
| Kovács Péter | Marketing | 850 000   |
| Nagy Anna    | IT        | 1 200 000 |

Gyakorlati tipp 1

Ha ###, ** és - jeleket látsz, az nem hiba — ez a Markdown struktúra része.

Gyakorlati tipp 2

Tudásbázis vagy projektmemória feltöltésénél a tiszta Markdown sokszor jobb kiindulópont, mint a tördelt PDF vagy DOCX.

XML és YAML

Strukturált promptolás: az utasítás és az adat szétválasztása.

Ha egy hosszú promptba csak beömleszted az utasításokat és az adatokat, a modell könnyen összekeveri, mi a szabály és mi a nyers tartalom. A strukturált jelölés segíti a szétválasztást — de önmagában nem garancia a biztonságra.

XML

Az XML tagek (pl. <context>, <task>, <data>) éles határt adnak, így csökken az összekeverés kockázata és javul a kontroll. Nem védelmi fal, de erős struktúra.

YAML

Behúzásos, hierarchikus szabályrendszerekhez és konfigurációkhoz ideális. Jól olvasható, kevés szintaktikai zaj, könnyen szerkeszthető.

XML-t használj

Ha hosszú dokumentumot, interjút vagy hírlevelet illesztesz a promptba, és fontos, hogy az adat és az instrukció élesen elváljon.

YAML-t használj

Ha szabályrendszert, agent viselkedést vagy konfigurációt írsz le, és az olvashatóság fontosabb, mint a szigorú gépi validálhatóság.

Multimodalitás

Nem minden bemenet egyformán megbízható.

A modell többféle inputtípust is tud kezelni, de ezek nem azonos pontosságúak és nem azonos kontrollszintűek. Érdemes megbízhatósági sorrendként gondolni rájuk, nem puszta funkciólistáként.

1.

Tiszta szöveg

A legjobban kontrollálható, legkönnyebben strukturálható, és általában ez adja a legstabilabb outputot. Ha átrakhatod ide az adatot, csináld meg.

2.

Strukturált táblázatos adat

CSV, jól szervezett Excel-export — erős elemzéshez és összehasonlításhoz, ha az adatminőség rendben van.

3.

Kép és PDF

Használható, de nagyobb a félreolvasás, formátumvesztés és táblázat-törés kockázata. Előbb érdemes tisztítani, ha lehetséges.

4.

Hang és videó

Ritkán érdemes közvetlenül elemeztetni. Előbb készíts transcriptet, utána dolgozz strukturált szöveggel — pontosabb és olcsóbb eredményt kapsz.

📝

Szöveg

Natív – ez az AI fő területe. Markdown, TXT, kód.

Kiváló
🖼️

Kép

Multimodális modellek (GPT-5.4, Gemini 3.1, Claude Opus 4.6) értik és elemzik.

📄

PDF

Feldolgozza, de a formázás elveszhet. Jobb: konvertáld Markdown-ra (Marker, MinerU).

Közepes
📊

CSV / Excel

Táblázatos adatokat jól elemez. Excelből CSV-t csinálj a feltöltés előtt.

💻

Kód

Natív – olvas, ír, javít, refaktorál. Python és JS a legjobb.

Kiváló
🎵

Hang / Videó

Whisper (OpenAI) átírja szöveggé, utána az LLM feldolgozza.

Közvetett

Gyakorlati szabály: ha ugyanazt az információt át tudod alakítani tiszta szöveggé vagy strukturált adattá, általában jobb eredményt kapsz, mint nyers multimodális inputból.

Mikor mit használj?

Gyors döntéstámogatás nyelvhez, formátumhoz és bemenethez.

Hosszú tudásanyagMarkdown
Szigorú mezős output / automationJSON
Hosszú dokumentum promptba ágyazásaXML
Konfiguráció / agent szabályrendszerYAML
Bonyolult magyar elemzésAngol reasoning + magyar végső output
Táblázatos adatCSV / tisztított export
Hosszú audio / videóTranscript először
NyelvAI tudás
🐍PythonNatív
📜JavaScript / TypeScriptNatív
🗄️SQLNatív
🌐HTML / CSSNatív
JavaErős
🔷C# / .NETErős
C / C++Erős
🦀Rust
🔵Go
🐘PHP
💎RubyMegfelelő
📊R
🖥️Shell / Bash
🍎SwiftMegfelelő
🤖KotlinMegfelelő

Gyakorlás

Teszteld magad AI-jal

A jó inputformátum kiválasztása ugyanúgy készség, mint maga a promptírás. Ezt akkor érted, ha külön tudsz dönteni nyelvről, formátumról és tisztítási lépésről.

Kérdezd meg az AI-t

  • Egy hosszú magyar PDF-ből mikor érdemes előbb tiszta Markdownot vagy transcriptet készíteni, és miért?
  • Mikor indokolt JSON, és mikor jobb inkább Markdownot, XML-t vagy YAML-t használni?

Kész prompt

Adj nekem 2 rövid AI-input helyzetet, és kérd meg, hogy válasszam ki a legjobb nyelvet és formátumot. A válaszom után indokold meg röviden, miért az a jobb döntés.

Zárás: a jó input nem mellékes részlet

A struktúra maga a minőség.

A prompt minősége fontos, de a modell teljesítménye nem csak attól függ, hogyan fogalmazol. Attól is függ, milyen nyelven gondolkodik, milyen formátumban kapja az adatot, és mennyi zajjal kell megküzdenie.

Ha fontos a logikai stabilitás, gondolkodj a munkanyelven. Ha fontos a kontroll, tisztítsd és strukturáld az inputot. Ha fontos a pontosság, csökkentsd a fölösleges formátumzajt. Ha fontos az újrahasználhatóság, válassz címkézett vagy szabályozott szerkezetet.