AI az újságírásban és az OSINT-ban
Ez a modul azt mutatja meg, hogyan épül be az AI az oknyomozó újságírás és az OSINT valós munkafolyamataiba. Nem AI-alapozó és nem általános newsroom-útmutató, hanem egy gyakorlati, workflow-alapú deep-dive arról, hogyan használható az AI kutatási, ellenőrzési és publikációs munkában időnyereségre és jobb munkaszervezésre.
Intake-től a trail és governance rétegig
Feladathoz, stackhez és emberi kontrollhoz
Nem külön leckék, hanem egy összefüggő rendszer
Vezetői összefoglaló
Az AI ott ad valódi értéket, ahol túl sok a forrás, túl sok a zaj, túl sok a formátum, és túl kevés az idő.
Az újságírói és OSINT munka fő nyeresége nem az, hogy az AI helyetted 'megmondja az igazat', hanem az, hogy előszűr, strukturál, kapcsolatokat emel ki, és gyorsabban visz el az ellenőrizhető állításokig.
A legnagyobb hiba az AI-t forrásként kezelni. A helyes modell az, hogy az AI segít keresni, bontani, szűrni, összekötni, priorizálni és előkészíteni.
A működő rendszer mindig több rétegből áll: beérkeztetés, előszűrés, adatkinyerés, dúsítás, ellenőrzés, szerkesztői előállítás, nyomvonal és governance.
A jó implementáció nem terméklista, hanem olyan workflow, ahol világos, mi az AI feladata, mi az emberé, és hogyan marad visszakövethető minden kritikus döntés.
Kiknek szól
Oknyomozó újságírók
Akik sok dokumentummal, videóval, nyilatkozattal és kapcsolati hálóval dolgoznak, és az előszűrésben, rendszerezésben akarnak gyorsulni.
OSINT-kutatók
Akik nyílt forrásokból építenek dossziékat, entity-listákat, idővonalakat és összefüggésrendszereket.
Fact-checkerek és research deskek
Akiknek nem a kreatív szöveg a fő feladatuk, hanem az állítások bizonyítékszintjének gyors és fegyelmezett kezelése.
Newsroom szerkesztők
Akik azt akarják eldönteni, hol hoz valódi időnyereséget az AI a kutatásban, és hol kell megmaradnia az emberi ellenőrzésnek.
Helyes mentális modell
Az AI nem igazságmotor. Az AI kutatási gyorsító és operációs réteg, amely előkészíti a munkát, de nem váltja ki a forrásminősítést, a szerkesztői ítéletet vagy a bizonyítási felelősséget.
Rossz modell
- Bedobom a kérdést, és majd a modell megmondja, mi igaz.
- Ha a modell összefoglalta, akkor a summary már publikációképes.
- Ha az AI talált kapcsolatot, akkor az már bizonyított kapcsolat.
Helyes modell
- A modell előszűr, strukturál és priorizál.
- Az ember ellenőriz, összevet, minősít és dönt.
- A publikációs állítások mögött mindig visszakereshető forráslánc kell.
Miért számít a gyakorlatban
A modern szerkesztőség fő szűk keresztmetszete gyakran nem az információ hiánya, hanem a feldolgozhatatlan mennyiség.
Videók, PDF-ek, közlemények, cégadatok, webes nyomok és archív anyagok együtt kezelése ma már multimodális workflow-feladat.
Az időnyereség önmagában kevés: a visszakövethetőség, az uncertainty-jelölés és a humán review ugyanilyen fontos.
Aki csak chatként használja az AI-t, az a felszíni gyorsulást kapja meg. Aki privacy-tudatos, hibrid workflow-rétegként használja, az szerkesztőségi vagy kutatási kapacitást nyer.
Az AI új képességtereket is megnyit: olyan nyílt forrású eszközök, Python-scriptek és GitHub-repók is használhatóvá válnak, amelyekhez korábban fejlesztői belépő kellett.
Kontextus és lehetőségtér
Ez a modul nem az AI-alapokról szól, hanem arról, hogy egy már ismert technológiát hogyan illesztesz be valós kutatási munkába. Itt minden blokkot úgy kell olvasni, hogy a fókusz az AI használati lehetőségein van: ha megjelenik egy nem-AI eszköz vagy workflow, az csak azért szerepel, mert az AI-val együtt lesz belőle gyorsabb, jobb vagy hozzáférhetőbb munkafolyamat.
A legnagyobb váltás nem az, hogy az AI gyorsabban összefoglal egy PDF-et, hanem az, hogy hozzáférési réteggé válik korábban technikai workflow-khoz is. Így nem csak dokumentumokat, hanem webes adatot, táblákat, kódot, nyílt repókat, geolokációs nyomokat és vizuális ellenőrzési feladatokat is közelebb hoz.
Kutatási kérdés / lead
Mi a kutatási kérdés, hipotézis vagy tipp, amivel a munka indul?
Források / bizonyítékok
Videó, URL, PDF, cégjegyzék, social nyom, archív anyag, táblázat vagy transzkript.
AI-feldolgozás
Összefoglalás, extraction, enrichment, scriptváz, mintázatjelölés, idővonal és entitáslista.
Emberi review
Forráskritika, ellentmondások kezelése, bizonyítékszint és publikációs kockázat megítélése.
Szerkesztői output
Briefing, memo, fact sheet, timeline, kérdéslista, cikkvázlat vagy kézirat-előkészítés.
Nyomvonal / governance
Forráslánc, uncertainty flag, review státusz, verzió és audit trail.
- •Python-scriptek írása és módosítása egyszerű extraction vagy tisztítási feladatokra
- •GitHub-repók megértése és futtatási belépőpontjainak feltárása
- •Scraper-ek, parser-ek és adatkinyerők adaptálása saját ügyre
- •CSV- és Excel-tisztítás, duplikációkezelés, oszlopnormalizálás
- •Geolokációs segédeszközök és vizuális ellenőrző workflow-k használata
- •Videó- és képkocka-alapú ellenőrzési munkafolyamatok előkészítése
A 7 workflow-réteg
Beérkeztetés
Mit?
A bejövő lead, dokumentum, videó vagy linkhalmaz első értelmezése és scope-olása.
Mivel?
Hogyan?
Feltöltöd vagy bemásolod a nyers inputot, kérsz egy rövid intake-summaryt, kulcsállítás-listát és nyitott kérdéseket, majd emberként eldöntöd, hogy ez valódi ügy-e vagy csak háttérzaj.
Mire való
A bejövő tipp, dokumentum, videó vagy kutatási kérdés rendezett fogadása.
Input
Email, üzenet, PDF, nyilvános videó, URL-gyűjtemény, táblázat, archív anyag.
AI szerepe
Gyors első összefoglaló, témacímkézés, explicit állítások és nyitott kérdések kiemelése. Például: egy 40 oldalas PDF-ből 8 pontos intake-jegyzet.
Emberi feladat
Eldönti, hogy a téma egyáltalán kutatásra érdemes-e, és milyen bizonyítékszintet igényel. Itt dől el az is, hogy breaking, háttéranyag vagy hosszabb ügy lesz belőle.
Tipikus output
Rövid intake note, kutatási kérdés, scope, hiányzó inputok listája.
Tipikus hibamód
Rosszul értelmezett lead, félreolvasott brief, túl korai túlértékelés vagy téves priorizálás.
Előszűrés
Mit?
A zaj és a releváns nyomok szétválasztása, valamint az első három kutatási irány kijelölése.
Mivel?
Hogyan?
A modell segítségével priorizálod a linkeket, dokumentumokat és szereplőket, majd kézzel kiválasztod, melyik szál kap időt, és melyik marad parkolópályán.
Mire való
A zaj és a releváns nyomok szétválasztása, az elsődleges irányok kijelölése.
Input
Első forráslista, nyers dokumentumhalmaz, több URL, transcript, screenshot, tippek.
AI szerepe
Tematizálás, duplikátumok észlelése, ellentmondásgyanús pontok jelölése, első prioritási lista. Például: melyik 3 linket nézd meg először a 20 közül.
Emberi feladat
Eldönti, melyik szál kapjon időt, mi marad háttérben, és hol kell azonnali kézi ellenőrzés.
Tipikus output
Prioritási lista, kutatási backlog, első munkahipotézisek.
Tipikus hibamód
Releváns szálak elvesztése, hamis pozitív kapcsolatok, túl sok zaj bent hagyása a következő körre.
Adatkinyerés
Mit?
Strukturálatlan anyagból kinyerhető név-, cég-, dátum-, összeg- és állításlista készítése.
Mivel?
Hogyan?
Feldolgoztatod a videót, PDF-et vagy OCR-anyagot, táblás formátumot kérsz, majd mintavételesen kézzel ellenőrzöd a kritikus mezőket, mielőtt ráépítesz a kimenetre.
Mire való
Strukturálatlan anyagból strukturált adat készítése.
Input
Videó, PDF, weboldal, OCR-ezett scan, transzkript, hosszú cikk, adatdump.
AI szerepe
Nevek, cégek, összegek, helyek, idézetek, állítások, szereplők és események kigyűjtése. Jó célformátum: Sheets-tábla vagy CSV.
Emberi feladat
Mintát ellenőriz, megnézi a kritikus mezőket, és eldönti, hogy a struktúra valóban használható-e.
Tipikus output
Entity tábla, timeline, állításlista, idézetjegyzék, strukturált CSV vagy JSON.
Tipikus hibamód
OCR-hibák, félreértett nevek, rossz időpontok, kiragadott idézetek, hibás mező-normalizálás.
Dúsítás
Mit?
A már kinyert entitások és időpontok kibővítése további nyílt forrású nyomokkal.
Mivel?
Hogyan?
Az entity-listából kiindulva új keresési köröket indítasz, registryket, archívumokat, hálózati nyomokat és kapcsolódó domaineket nézel meg, miközben az AI a következő kérdéseket és összekötéseket javasolja.
Mire való
Az alapvető adatpontok kibővítése további nyílt forrásokkal és keresési lépésekkel.
Input
Entity lista, domain, cég, személy, idővonal, dokumentumhivatkozások, registry linkek.
AI szerepe
Javaslatot tesz további keresésekre, összekapcsolja a forrásokat, scriptvázat ír, vagy segít böngészős munkafolyamatot előkészíteni. Például: registry, archive.org, cégadatbázis, LinkedIn-céglap.
Emberi feladat
Felügyeli a keresési irányt, ellenőrzi a kritikus összekötéseket, és féken tartja a spekulációt.
Tipikus output
Bővített dosszié, kapcsolati háló, enriched entity rekordok, új ellenőrizendő szálak.
Tipikus hibamód
Összefüggés és okság összekeverése, rossz entitás-összevezetés, prompt injection vagy webes zaj túlértékelése.
Ellenőrzés
Mit?
Az állítások bizonyítékszintjének, forrásláncának és ellentmondásainak ellenőrzése.
Mivel?
Hogyan?
Összeveted a forrásokat, külön címkézed a biztos és bizonytalan állításokat, a vizuális elemeket klasszikus verifikációs eszközökkel is ellenőrzöd, és csak azután engeded tovább az anyagot.
Mire való
Az állítások bizonyítékszintjének és forrásláncának szigorú ellenőrzése.
Input
Állításlista, forráslánc, idézetek, enriched dosszié, timeline, archive snapshot.
AI szerepe
Segít összevetni a forrásokat, jelöli az ellentmondásokat, bizonytalansági címkét ad és ellenőrzőlistát készít.
Emberi feladat
A végső forrásminősítés, visszahallgatás, kézi registry-check és publikálhatósági döntés kizárólag emberi feladat.
Tipikus output
Confirmed / plausible / contradicted / unknown jelölés, fact sheet, ellenőrzési lista.
Tipikus hibamód
Az AI forrásként kezelése, hamis biztonságérzet, ellenőrizetlen secondary summary-k publikációs használata.
Szerkesztői előállítás
Mit?
Az ellenőrzött anyag briefinggé, kérdéslistává, cikkvázlattá vagy belső memóvá alakítása.
Mivel?
Hogyan?
Az AI-val elkészíted az első szerkesztői draftot vagy briefinget, majd emberként tisztítod a narratívát, visszateszed a bizonyítékszinteket, és eldöntöd, mi publikálható.
Mire való
Az ellenőrzött anyag szerkesztőségi vagy kutatási outputtá alakítása.
Input
Review-zott jegyzetek, fact sheet, entity tábla, timeline, kulcsidézetek, angle.
AI szerepe
Briefinget, memót, kérdéslistát, cikkvázlatot, interjú-előkészítést vagy belső összefoglalót készít.
Emberi feladat
Megírja, szerkeszti, finomítja a narratívát, és vállalja a szakmai felelősséget.
Tipikus output
Szerkesztői briefing, cikkvázlat, outline, publikációs draft, belső memo.
Tipikus hibamód
Túl sima, de túl általános szöveg, bizonytalan állítások kimosása, látszólag kész, valójában review-éhes draft.
Trail & governance
Mit?
A kutatási útvonal, a review és a döntési pontok visszakövethető dokumentálása.
Mivel?
Hogyan?
Forrásnaplót, review státuszt és döntési logot vezetsz, hogy később is vissza lehessen nézni, melyik állítás miből, milyen promptból és milyen ellenőrzési körből került be.
Mire való
A kutatási útvonal, a review és a döntések visszakövethetőségének fenntartása.
Input
Promptok, források, screenshotok, review státuszok, verziók, uncertainty címkék.
AI szerepe
Segíthet logot rendezni, összefoglalni a kutatási lépéseket és annotált nyomvonalat fenntartani. Itt kell látszania, melyik állítás melyik linkből, PDF-ből vagy videórészletből jött.
Emberi feladat
Kijelöli, mi számít elfogadható bizonyítéknak, és fenntartja a governance szabályokat.
Tipikus output
Audit trail, forrásnapló, review státusz, publish / not publish döntési lánc.
Tipikus hibamód
Hiányzó source trace, eltűnő döntési pontok, log nélküli agenthasználat és később nem védhető állítások.
Döntési táblák
1. Feladat → AI-réteg / eszköztípus
| Feladat | AI-réteg | Eszköztípus |
|---|---|---|
| 90 perces videó bontása | Extraction | Gemini, NotebookLM, ChatGPT |
| Bejövő lead gyors előszűrése | Intake / triage | ChatGPT Projects, Claude |
| Nevek, cégek, összegek kigyűjtése | Extraction | Claude, ChatGPT, + táblázat/CSV |
| További registry- és webes nyomok keresése | Enrichment | Perplexity, browser agent, kézi registry-check |
| Források közti ellentmondások kiemelése | Verification | Claude, ChatGPT, + manuális source trace |
| Cikkvázlat vagy briefing készítése | Production | ChatGPT, Claude, + emberi review |
| Kutatási útvonal dokumentálása | Trail & governance | Notion, Google Docs, Google Sheets |
2. Tool-választási döntési tábla
| Helyzet | Eszköztípus | Mikor ezt válaszd |
|---|---|---|
| Gyors intake és összefoglalás | Okara, ChatGPT Projects, Claude, Gemini | Ha sok bejövő anyagból kell gyorsan eldönteni, mi érdemes mélyítésre. Érzékeny anyagnál előny a privát workspace vagy a no-training ígéret. |
| Multimodális feldolgozás | Pinpoint, NotebookLM, Gemini | Ha videóból, PDF-ből, screenshotból és webes anyagból kell egyszerre dolgozni, és dokumentumhalmazban kell keresni. |
| Entity és timeline extraction | Claude, ChatGPT, Sheets, Excel | Ha strukturálatlan inputból táblázható adatot, entitáslistát vagy idővonalat kell előállítani. |
| Böngészős adatgyűjtés | Playwright, browser agent, Tor Browser, manuális böngészés | Ha nincs API, sok a kattintás, és kontrollált UI-lépésekre van szükség örökségi registrykben, archive-oldalakon vagy érzékeny kutatási környezetben. |
| Scraping / parsing | Python, pandas, Playwright, requests, Codex, Copilot Agents | Ha ismétlődő webes vagy dokumentumkinyerési feladatot kell formalizálni és auditálhatóvá tenni. |
| Audit trail és kutatási memória | Notion, Google Docs, Google Sheets, Airtable | Ha fontos később visszanézni, melyik állítás honnan jött, mi lett megerősítve és mi maradt nyitott. |
| Végső szerkesztői output | ChatGPT, Claude, + emberi edit | Ha már ellenőrzött anyagból kell briefinget, memót, kérdéslistát vagy cikkvázlatot készíteni. |
3. Lean / Standard / Advanced stack
| Réteg | Lean | Standard | Advanced |
|---|---|---|---|
| Munkakörnyezet | 1 újságíró vagy nagyon kis csapat, kézi source loggal | Kis-közepes newsroom vagy NGO research desk fix workflow-val | Investigative unit vagy research desk több párhuzamos üggyel |
| Fő eszköztípus | Okara, Claude, NotebookLM, Gemini, Sheets | Okara, Claude, ChatGPT, Pinpoint, NotebookLM, Python/pandas, Sheets, Airtable | Privát AI, Pinpoint, NotebookLM, Playwright, SpiderFoot, Maltego, Notion, Airtable |
| Mire elég | Videóösszefoglalás, alap extraction, kézi ellenőrzés, briefing | Félautomata extraction, timeline, entity tábla, rendszeres verification | Monitoring, állandó enrichment, browser taskok, auditálható kutatási folyamat |
| Emberi kontroll | Minden kritikus pont kézi review | Mintavételes és állításalapú review, plusz szerkesztői checkpoint | Formális approval gate-ek, uncertainty labeling, verzió- és trail-fegyelem |
| Tipikus kockázat | A summary-k túlértékelése | A scriptből vagy extractionből jövő mezők túlzott bizalma | Az agent- és browser-lépések kontrollvesztése log és sandbox nélkül |
4. Human vs AI döntési tábla
| Feladat | Ki dominál | Miért |
|---|---|---|
| Lead előszűrés | AI segíthet | Gyors beérkeztetési összefoglaló és témajelölés |
| Entity-lista első verziója | AI segíthet | Nyers kigyűjtés és normalizálás |
| Timeline első draftja | AI segíthet | Események strukturálása és dátumok rendezése |
| Primer forrás minősítése | Ember dönt | Bizonyítékszint és hitelesség nem delegálható |
| Végső fact-check | Ember dönt | Az AI nem automatikus fact-checker |
| Publikációs állítás megfogalmazása | Ember dönt | Jog, etika és kontextus miatt |
| Briefing vagy outline előkészítése | Közös munka | AI draftol, ember szerkeszt és vállal felelősséget |
A lényeg ugyanaz marad: az AI nem forrás, nem bizonyíték, nem automatikus fact-checker.
Maturity modell: Lean / Standard / Advanced
Lean
Freelancer vagy kis szerkesztőség számára. A cél az előszűrés, a videó- és dokumentumbontás, az entity-lista és a briefing gyorsítása kézi source log mellett.
Standard
Kis-közepes newsroom vagy NGO/OSINT csapat számára. Már van fix extraction, strukturált adatkezelés, rendszeres review és többféle input kombinálása.
Advanced
Investigative unit vagy research desk számára. Tool-use, browser workflow, trail-management és formalizált approval gate-ek együtt adnak kontrollált gyorsulást.
Mit jelent ez nem-informatikusoknak?
A cél itt nem az, hogy fejlesztővé válj, hanem az, hogy használható kapcsolatod legyen azokhoz az eszközökhöz és munkafolyamatokhoz, amelyek korábban túl technikaiak voltak. Az AI segíthet repókat megérteni, egyszerű scripteket kérni, scraping-logikát előkészíteni és a kézi kutatást strukturáltabbá tenni.
Python nem-informatikusoknak
Nem az a cél, hogy fejlesztővé válj, hanem az, hogy meg tudd kérni az AI-t: írjon egy kis scriptet PDF-ek, CSV-k, céglisták vagy rekordok tisztítására és extractionjére.
GitHub mint eszközkönyvtár
A GitHub tele van az AI előtti világból maradt nyílt eszközökkel. Az AI segíthet megérteni, mire jó egy repo, hogyan kell futtatni, és mit tudsz belőle a saját ügyedre átvenni.
Nem mindent nulláról kell építeni
Sokszor elég egy meglévő scraper, parser, geolokációs vagy videóellenőrző eszköz mellé AI-t tenni, hogy használhatóvá váljon számodra.
Az AI itt hozzáférési réteg
A modell nem a bizonyítékot adja, hanem csökkenti a technikai belépési küszöböt olyan workflow-khoz, amelyek korábban túl bonyolultak voltak.
Konkrét eszközterek
AI research és dokumentumelemzés
Okara, Pinpoint, NotebookLM, Gemini, Claude, ChatGPT Projects
Nagy dokumentumhalmaz, transzkript, sajtóanyag, jegyzőkönyv és PDF gyors bontása, keresése és előszűrése.
AI-val támogatott OSINT útvonaltervezés
Perplexity, Claude, ChatGPT Projects, Bellingcat Toolkit, OSINT Framework
A megfelelő nyomozási útvonal és eszközkategória kiválasztása, amikor még nem világos, hogy reverse image, domain, geolocation vagy registry irány lesz a jó.
AI-val előkészített háló- és infrastruktúrakutatás
Claude, ChatGPT, SpiderFoot, Maltego, Shodan
Személy–cég–domain–IP–eszköz kapcsolatok feltérképezése, digitális lábnyomok és hálózati összefüggések vizsgálata AI-val előkészített kérdéslistákkal és entity-normalizálással.
AI-val támogatott kép- és videóellenőrzés
Gemini, Claude, InVID, Amnesty YouTube DataViewer, ExifTool
Kulcsképkockák, feltöltési időpontok, fordított képkeresés és metaadatok ellenőrzése deepfake- vagy félrevezető vizuális tartalom esetén, AI-val gyorsított első hipotézisalkotással.
További AI-eszközterek, amiket érdemes ismerni
A workflow-mag mellé érdemes látni még néhány olyan eszközteret is, amelyek tovább bővítik, hogy az AI-val pontosan mit és mivel lehet jobban csinálni ebben a munkában.
Nagy dokumentumhalmazoknál a dokumentumkeresés és a forrásalapú jegyzetelés erősíthető
A mostani modulban jó az extraction-logika, de érdemes erősebben megmutatni a dokumentumkollekció-szintű munkát is. A Google-féle Pinpoint kifejezetten újságíróknak készült nagy dokumentum-, hang- és képhalmazok keresésére, míg a NotebookLM a saját forrásaidból épít kontextust.
Mivel? Pinpoint, NotebookLM
A GitHub és a kódolási agentek külön AI-képességtérként érdemesek megjelenni
Az oldal már említi a Python- és GitHub-vonalat, de ezt érdemes konkrétabbá tenni. A GitHub maga is forrás lehet, az AI-kódagentek pedig már képesek repókat olvasni, kódot módosítani és parancsokat futtatni, ami nem-informatikusoknak is lejjebb viszi a belépési küszöböt.
Mivel? GitHub Copilot Agents, OpenAI Codex, Octosuite
Forrás: OpenAI code generation guide
A vizuális és geotérbeli ellenőrzés bővíthető AI- és GeoAI-eszközökkel
A klasszikus vizuális verifikáció mellé ma már érdemes beemelni az AI-geolokáció és a természetes nyelvű geotérbeli keresés példáit is. Ez nem váltja ki a kézi ellenőrzést, de új nyomozási irányokat nyit.
Mivel? InVID Verification Plugin, GeoSpy, SPOT
Forrás: GeoSpy Pro
A háló- és infrastruktúrakutatásnál a kombinált stacket érdemes explicitebbé tenni
A jelenlegi modul említi a hálózati és infrastruktúra-vonalat, de érdemes jobban kimondani, hogy itt a valódi erő a kombinációban van: az AI előkészíti a kérdéseket és normalizálja az entitásokat, a SpiderFoot, a Maltego és a Shodan pedig más-más nézetből gazdagítják a képet.
Mivel? SpiderFoot, Maltego, Shodan
Forrás: SpiderFoot README
Gyakorlati use case-ek
Sajtótájékoztatóból szerkesztői briefing
Egy 90 perces videóból ki kell emelni a kulcsállításokat, a pénzügyi számokat, a szereplőket és a visszahallgatandó pontokat.
Mit?
Egy 90 perces videóból ki kell emelni a kulcsállításokat, a pénzügyi számokat, a szereplőket és a visszahallgatandó pontokat.
Mivel?
Hogyan?
Videófeltöltés → állításlista → timestamp-ellenőrzés → briefing
Workflow-lépések
- 1Töltsd fel a videót Gemini-be vagy NotebookLM-be.
- 2Kérj külön listát a szereplőkről, a számokról és a konkrét állításokról.
- 3Jelöld ki a 5–10 legkritikusabb állítást, és kézzel hallgasd vissza az időbélyegek alapján.
- 4A biztos állításokat vidd át egy briefingbe, a bizonytalanokat külön blokkba tedd.
Tipikus output: Timestampelt állításlista, ellenőrizendő számok, 8 pontos briefing, külön uncertainty-jelöléssel.
Közbeszerzési háló előkészítése
Tenderoldalakról és kapcsolódó PDF-ekből kell cégek, összegek, dátumok és partnerkapcsolatok első listáját felépíteni.
Mit?
Tenderoldalakról és kapcsolódó PDF-ekből kell cégek, összegek, dátumok és partnerkapcsolatok első listáját felépíteni.
Mivel?
Hogyan?
PDF extraction → táblás normalizálás → háttérkutatás → registry-check
Workflow-lépések
- 1Extractáld a PDF-ekből a cégeket, összegeket, dátumokat és tenderazonosítókat.
- 2Rendezd egységes táblába a rekordokat Sheetsben.
- 3Perplexityvel kérj háttérkutatási irányokat a cégekre és a kulcsszereplőkre.
- 4Minden fontos rekordot ellenőrizz vissza cégjegyzékben vagy hivatalos forrásban.
Tipikus output: CSV vagy táblázat, entity normalizálás, első timeline és a kézi ellenőrzést igénylő rekordok listája.
Lead triage kis newsroomban
Hetente több tipp, email és dokumentum érkezik, de kevés ember jut az első körös értékelésre.
Mit?
Hetente több tipp, email és dokumentum érkezik, de kevés ember jut az első körös értékelésre.
Mivel?
Hogyan?
Lead-begyűjtés → intake-summary → priorizálás → scope-döntés
Workflow-lépések
- 1Minden beérkező emailből, PDF-ből és linkből készíts rövid intake-summaryt.
- 2A summaryk alapján címkézd a leadeket: breaking, háttér, későbbre parkolható.
- 3A legígéretesebb ügyekhez írasd ki azonnal a nyitott kérdéseket és a hiányzó adatokat.
- 4Az emberi szerkesztő döntse el, melyik ügyből lesz valódi kutatás.
Tipikus output: Scope-olt backlog, kutatási prioritások, nyitott kérdések és gyors kockázati címkézés.
Legacy registry böngészős bejárása
Sok kattintásos, API nélküli nyilvántartásból kell standard mezőket kigyűjteni több szereplőre.
Mit?
Sok kattintásos, API nélküli nyilvántartásból kell standard mezőket kigyűjteni több szereplőre.
Mivel?
Hogyan?
Böngészés → rekordgyűjtés → naplózás → exception review
Workflow-lépések
- 1Határozd meg előre a kigyűjtendő mezőket és a kivételek listáját.
- 2Playwrighttal vagy kézi lépésekkel gyűjtsd ki a rekordokat ugyanabban a sorrendben.
- 3Minden rekordhoz ments linket vagy screenshotot, hogy később visszaellenőrizhető legyen.
- 4A sikertelen vagy bizonytalan találatokat külön exception queue-ba tedd kézi ellenőrzésre.
Tipikus output: Strukturált mezőlista, screenshot-trail, hibalog és exception queue a kézi visszaadásra.
QC / verification / governance
Ez az a réteg, ahol eldől, hogy az AI által előállított köztes anyagból lesz-e valóban védhető szerkesztőségi munka. Nem elég a gyors summary vagy az entity-lista: kell forrásnyomvonal, uncertainty-jelölés, emberi review és visszakereshető döntési út is.
Forrásnyomvonal
Minden állítás mögött legyen primer vagy ellenőrizhető másodlagos forrás, és külön jelölve legyen, ha valami csak AI-köztes jegyzet.
Bizonyossági címkézés
Minden fontos rekord vagy állítás kapjon bizonyossági státuszt: confirmed, plausible but unverified, contradicted vagy unknown. Ezt érdemes külön oszlopban vezetni a táblában.
Emberi kontrollpontok
Kritikus pontokon kötelező legyen a kézi ellenőrzés: extraction után, publikáció előtt, és érzékeny jogi állításoknál külön review-ban.
Audit trail
Legyen visszakereshető, mit nézett meg az AI, milyen prompt ment ki, mely források jöttek vissza és mi lett elfogadva vagy elvetve.
Gyors checklist
- ✓A cikkbe vagy briefingbe kerülő minden kritikus állításnak van visszakövethető forrása.
- ✓Az uncertainty-jelölések nem vesztek el a production rétegben.
- ✓A videóból vagy transzkriptből vett idézetek vissza lettek hallgatva vagy ellenőrizve.
- ✓A scriptből, extractionből vagy browser-lépésből jövő rekordok legalább mintavételesen át lettek nézve.
- ✓A publikációs döntés előtt a humán reviewer külön végigment a bizonyítékszinten.
Korlátok és failure mode-ok
- –Hallucináció: a modell magabiztosan állít olyat is, amit nem tud bizonyítani.
- –Rossz forrásértelmezés: összefüggést lát ott is, ahol csak közelség vagy véletlen együttállás van.
- –OCR- és transzkripthibák: rossz név, rossz dátum vagy rossz összeg bekerül a struktúrába.
- –Böngésző-automatizálás törékenysége: captcha, layoutváltás, dinamikus tartalom vagy prompt injection.
- –Túl sima szerkesztői draft: a szöveg jónak tűnik, de a mögöttes bizonyítékszint gyenge.
- –Trail hiánya: később nem védhető, hogy egy állítás melyik forrásláncon jutott be a sztoriba.
Ami elsőre kimarad
- →A forrásnapló és a kutatási nyomvonal legalább olyan fontos, mint maga az AI-eszköz.
- →Az emberi ellenőrzés nem a végére odabiggyesztett formalitás, hanem külön munkaréteg.
- →A jó stack nem azonos a 'legerősebb modellel' - sokszor a szervezettség többet számít, mint a nyers modellképesség.
- →A videó- vagy PDF-összefoglaló sosem egyenlő a primer forrással. Idézni csak visszahallgatás és ellenőrzés után szabad.
- →A böngészős vagy scraperes workflow csak akkor hoz értéket, ha a hibakezelés, a naplózás és az exception queue is meg van tervezve.
Döntési keret
Érdemes, ha
- ✓Sok a repetitív kutatási feladat, és a csapat ideje a bottleneck.
- ✓Rendszeresen dolgoztok videóval, PDF-fel, registry-anyagokkal vagy nagy URL-halmazokkal.
- ✓Van legalább alapvető forrásfegyelem és hajlandóság a logolásra.
- ✓A cél nem varázslat, hanem gyorsabb beérkeztetés, adatkinyerés és ellenőrzés.
Korai vagy rossz fit, ha
- –Nincs standard kutatási folyamat, csak alkalmi improvizáció.
- –Nincs kijelölt ember, aki a review-t és a source quality-t viszi.
- –Érzékeny ügyben teljes automatizmust akartok human gate nélkül.
- –A csapat a modellt elsődleges bizonyítási rétegként szeretné kezelni.
| Mód | Mikor elég / mikor kell |
|---|---|
| Sima chat | Kevés ügy, kevés input, gyors manuális kutatássegítés |
| Multimodális modell | Videó, PDF és URL egyszerre fontos input |
| Script + kódfuttatás réteg | Ismétlődő adatkinyerési vagy parsing feladat van |
| Böngészős / tool-use réteg | Sok kattintásos, API nélküli workflow-t kell bejárni |
| Trail / governance réteg | Később is védeni kell a forrásláncot és a döntési utat |
Építs saját workflow-t
- 1Válassz ki 1 videós, 1 dokumentumos és 1 webes kutatási feladatot, amit tényleg ismételtek.
- 2Írd le külön, hol van intake, triage, extraction, enrichment, verification és production a jelenlegi folyamatban.
- 3Jelöld ki, melyik lépésnél segít az AI, és melyik pont marad kizárólag emberi review.
- 4Rögzíts fix outputformákat: entity tábla, timeline, fact sheet, briefing.
- 5Vezess be uncertainty-jelölést és source logot már a pilotban.
- 6Csak akkor mélyíts browser- vagy agentirányba, ha a kisebb pilot már reprodukálható és auditálható.