🔍 Kutatás modulHaladó~55 perc

AI az újságírásban és az OSINT-ban

Ez a modul azt mutatja meg, hogyan épül be az AI az oknyomozó újságírás és az OSINT valós munkafolyamataiba. Nem AI-alapozó és nem általános newsroom-útmutató, hanem egy gyakorlati, workflow-alapú deep-dive arról, hogyan használható az AI kutatási, ellenőrzési és publikációs munkában időnyereségre és jobb munkaszervezésre.

Pozicionálás: Az AI nem forrás, nem bizonyíték, nem automatikus fact-checker, hanem kutatási gyorsító és operációs réteg.

7 workflow-réteg

Intake-től a trail és governance rétegig

4 döntési tábla

Feladathoz, stackhez és emberi kontrollhoz

1 hosszú modul

Nem külön leckék, hanem egy összefüggő rendszer

Vezetői összefoglaló

Az AI ott ad valódi értéket, ahol túl sok a forrás, túl sok a zaj, túl sok a formátum, és túl kevés az idő.

Az újságírói és OSINT munka fő nyeresége nem az, hogy az AI helyetted 'megmondja az igazat', hanem az, hogy előszűr, strukturál, kapcsolatokat emel ki, és gyorsabban visz el az ellenőrizhető állításokig.

A legnagyobb hiba az AI-t forrásként kezelni. A helyes modell az, hogy az AI segít keresni, bontani, szűrni, összekötni, priorizálni és előkészíteni.

A működő rendszer mindig több rétegből áll: beérkeztetés, előszűrés, adatkinyerés, dúsítás, ellenőrzés, szerkesztői előállítás, nyomvonal és governance.

A jó implementáció nem terméklista, hanem olyan workflow, ahol világos, mi az AI feladata, mi az emberé, és hogyan marad visszakövethető minden kritikus döntés.

Kiknek szól

Oknyomozó újságírók

Akik sok dokumentummal, videóval, nyilatkozattal és kapcsolati hálóval dolgoznak, és az előszűrésben, rendszerezésben akarnak gyorsulni.

OSINT-kutatók

Akik nyílt forrásokból építenek dossziékat, entity-listákat, idővonalakat és összefüggésrendszereket.

Fact-checkerek és research deskek

Akiknek nem a kreatív szöveg a fő feladatuk, hanem az állítások bizonyítékszintjének gyors és fegyelmezett kezelése.

Newsroom szerkesztők

Akik azt akarják eldönteni, hol hoz valódi időnyereséget az AI a kutatásban, és hol kell megmaradnia az emberi ellenőrzésnek.

Helyes mentális modell

Az AI nem igazságmotor. Az AI kutatási gyorsító és operációs réteg, amely előkészíti a munkát, de nem váltja ki a forrásminősítést, a szerkesztői ítéletet vagy a bizonyítási felelősséget.

Rossz modell

Bedobom a kérdést, és majd a modell megmondja, mi igaz.
Ha a modell összefoglalta, akkor a summary már publikációképes.
Ha az AI talált kapcsolatot, akkor az már bizonyított kapcsolat.

Helyes modell

A modell előszűr, strukturál és priorizál.
Az ember ellenőriz, összevet, minősít és dönt.
A publikációs állítások mögött mindig visszakereshető forráslánc kell.

Miért számít a gyakorlatban

A modern szerkesztőség fő szűk keresztmetszete gyakran nem az információ hiánya, hanem a feldolgozhatatlan mennyiség.

Videók, PDF-ek, közlemények, cégadatok, webes nyomok és archív anyagok együtt kezelése ma már multimodális workflow-feladat.

Az időnyereség önmagában kevés: a visszakövethetőség, az uncertainty-jelölés és a humán review ugyanilyen fontos.

Aki csak chatként használja az AI-t, az a felszíni gyorsulást kapja meg. Aki privacy-tudatos, hibrid workflow-rétegként használja, az szerkesztőségi vagy kutatási kapacitást nyer.

Az AI új képességtereket is megnyit: olyan nyílt forrású eszközök, Python-scriptek és GitHub-repók is használhatóvá válnak, amelyekhez korábban fejlesztői belépő kellett.

Kontextus és lehetőségtér

Ez a modul nem az AI-alapokról szól, hanem arról, hogy egy már ismert technológiát hogyan illesztesz be valós kutatási munkába. Itt minden blokkot úgy kell olvasni, hogy a fókusz az AI használati lehetőségein van: ha megjelenik egy nem-AI eszköz vagy workflow, az csak azért szerepel, mert az AI-val együtt lesz belőle gyorsabb, jobb vagy hozzáférhetőbb munkafolyamat.

A legnagyobb váltás nem az, hogy az AI gyorsabban összefoglal egy PDF-et, hanem az, hogy hozzáférési réteggé válik korábban technikai workflow-khoz is. Így nem csak dokumentumokat, hanem webes adatot, táblákat, kódot, nyílt repókat, geolokációs nyomokat és vizuális ellenőrzési feladatokat is közelebb hoz.

Kutatási kérdés / lead

Mi a kutatási kérdés, hipotézis vagy tipp, amivel a munka indul?

Források / bizonyítékok

Videó, URL, PDF, cégjegyzék, social nyom, archív anyag, táblázat vagy transzkript.

AI-feldolgozás

Összefoglalás, extraction, enrichment, scriptváz, mintázatjelölés, idővonal és entitáslista.

Emberi review

Forráskritika, ellentmondások kezelése, bizonyítékszint és publikációs kockázat megítélése.

Szerkesztői output

Briefing, memo, fact sheet, timeline, kérdéslista, cikkvázlat vagy kézirat-előkészítés.

Nyomvonal / governance

Forráslánc, uncertainty flag, review státusz, verzió és audit trail.

•Python-scriptek írása és módosítása egyszerű extraction vagy tisztítási feladatokra
•GitHub-repók megértése és futtatási belépőpontjainak feltárása
•Scraper-ek, parser-ek és adatkinyerők adaptálása saját ügyre
•CSV- és Excel-tisztítás, duplikációkezelés, oszlopnormalizálás
•Geolokációs segédeszközök és vizuális ellenőrző workflow-k használata
•Videó- és képkocka-alapú ellenőrzési munkafolyamatok előkészítése

A 7 workflow-réteg

Beérkeztetés

Mit?

A bejövő lead, dokumentum, videó vagy linkhalmaz első értelmezése és scope-olása.

Mivel?

Okara, ChatGPT Projects, Claude, Gemini

Hogyan?

Feltöltöd vagy bemásolod a nyers inputot, kérsz egy rövid intake-summaryt, kulcsállítás-listát és nyitott kérdéseket, majd emberként eldöntöd, hogy ez valódi ügy-e vagy csak háttérzaj.

Mire való

A bejövő tipp, dokumentum, videó vagy kutatási kérdés rendezett fogadása.

Input

Email, üzenet, PDF, nyilvános videó, URL-gyűjtemény, táblázat, archív anyag.

AI szerepe

Gyors első összefoglaló, témacímkézés, explicit állítások és nyitott kérdések kiemelése. Például: egy 40 oldalas PDF-ből 8 pontos intake-jegyzet.

Emberi feladat

Eldönti, hogy a téma egyáltalán kutatásra érdemes-e, és milyen bizonyítékszintet igényel. Itt dől el az is, hogy breaking, háttéranyag vagy hosszabb ügy lesz belőle.

Tipikus output

Rövid intake note, kutatási kérdés, scope, hiányzó inputok listája.

Tipikus hibamód

Rosszul értelmezett lead, félreolvasott brief, túl korai túlértékelés vagy téves priorizálás.

Előszűrés

Mit?

A zaj és a releváns nyomok szétválasztása, valamint az első három kutatási irány kijelölése.

Mivel?

Perplexity, Claude, ChatGPT, OSINT Framework

Hogyan?

A modell segítségével priorizálod a linkeket, dokumentumokat és szereplőket, majd kézzel kiválasztod, melyik szál kap időt, és melyik marad parkolópályán.

Mire való

A zaj és a releváns nyomok szétválasztása, az elsődleges irányok kijelölése.

Input

Első forráslista, nyers dokumentumhalmaz, több URL, transcript, screenshot, tippek.

AI szerepe

Tematizálás, duplikátumok észlelése, ellentmondásgyanús pontok jelölése, első prioritási lista. Például: melyik 3 linket nézd meg először a 20 közül.

Emberi feladat

Eldönti, melyik szál kapjon időt, mi marad háttérben, és hol kell azonnali kézi ellenőrzés.

Tipikus output

Prioritási lista, kutatási backlog, első munkahipotézisek.

Tipikus hibamód

Releváns szálak elvesztése, hamis pozitív kapcsolatok, túl sok zaj bent hagyása a következő körre.

Adatkinyerés

Mit?

Strukturálatlan anyagból kinyerhető név-, cég-, dátum-, összeg- és állításlista készítése.

Mivel?

Pinpoint, NotebookLM, Claude, ChatGPT, Google Sheets

Hogyan?

Feldolgoztatod a videót, PDF-et vagy OCR-anyagot, táblás formátumot kérsz, majd mintavételesen kézzel ellenőrzöd a kritikus mezőket, mielőtt ráépítesz a kimenetre.

Mire való

Strukturálatlan anyagból strukturált adat készítése.

Input

Videó, PDF, weboldal, OCR-ezett scan, transzkript, hosszú cikk, adatdump.

AI szerepe

Nevek, cégek, összegek, helyek, idézetek, állítások, szereplők és események kigyűjtése. Jó célformátum: Sheets-tábla vagy CSV.

Emberi feladat

Mintát ellenőriz, megnézi a kritikus mezőket, és eldönti, hogy a struktúra valóban használható-e.

Tipikus output

Entity tábla, timeline, állításlista, idézetjegyzék, strukturált CSV vagy JSON.

Tipikus hibamód

OCR-hibák, félreértett nevek, rossz időpontok, kiragadott idézetek, hibás mező-normalizálás.

Dúsítás

Mit?

A már kinyert entitások és időpontok kibővítése további nyílt forrású nyomokkal.

Mivel?

Perplexity, SpiderFoot, Maltego, Shodan, Wayback Machine

Hogyan?

Az entity-listából kiindulva új keresési köröket indítasz, registryket, archívumokat, hálózati nyomokat és kapcsolódó domaineket nézel meg, miközben az AI a következő kérdéseket és összekötéseket javasolja.

Mire való

Az alapvető adatpontok kibővítése további nyílt forrásokkal és keresési lépésekkel.

Input

Entity lista, domain, cég, személy, idővonal, dokumentumhivatkozások, registry linkek.

AI szerepe

Javaslatot tesz további keresésekre, összekapcsolja a forrásokat, scriptvázat ír, vagy segít böngészős munkafolyamatot előkészíteni. Például: registry, archive.org, cégadatbázis, LinkedIn-céglap.

Emberi feladat

Felügyeli a keresési irányt, ellenőrzi a kritikus összekötéseket, és féken tartja a spekulációt.

Tipikus output

Bővített dosszié, kapcsolati háló, enriched entity rekordok, új ellenőrizendő szálak.

Tipikus hibamód

Összefüggés és okság összekeverése, rossz entitás-összevezetés, prompt injection vagy webes zaj túlértékelése.

Ellenőrzés

Mit?

Az állítások bizonyítékszintjének, forrásláncának és ellentmondásainak ellenőrzése.

Mivel?

Claude, ChatGPT, InVID, ExifTool, Amnesty YouTube DataViewer

Hogyan?

Összeveted a forrásokat, külön címkézed a biztos és bizonytalan állításokat, a vizuális elemeket klasszikus verifikációs eszközökkel is ellenőrzöd, és csak azután engeded tovább az anyagot.

Mire való

Az állítások bizonyítékszintjének és forrásláncának szigorú ellenőrzése.

Input

Állításlista, forráslánc, idézetek, enriched dosszié, timeline, archive snapshot.

AI szerepe

Segít összevetni a forrásokat, jelöli az ellentmondásokat, bizonytalansági címkét ad és ellenőrzőlistát készít.

Emberi feladat

A végső forrásminősítés, visszahallgatás, kézi registry-check és publikálhatósági döntés kizárólag emberi feladat.

Tipikus output

Confirmed / plausible / contradicted / unknown jelölés, fact sheet, ellenőrzési lista.

Tipikus hibamód

Az AI forrásként kezelése, hamis biztonságérzet, ellenőrizetlen secondary summary-k publikációs használata.

Szerkesztői előállítás

Mit?

Az ellenőrzött anyag briefinggé, kérdéslistává, cikkvázlattá vagy belső memóvá alakítása.

Mivel?

ChatGPT, Claude, Google Docs, Notion

Hogyan?

Az AI-val elkészíted az első szerkesztői draftot vagy briefinget, majd emberként tisztítod a narratívát, visszateszed a bizonyítékszinteket, és eldöntöd, mi publikálható.

Mire való

Az ellenőrzött anyag szerkesztőségi vagy kutatási outputtá alakítása.

Input

Review-zott jegyzetek, fact sheet, entity tábla, timeline, kulcsidézetek, angle.

AI szerepe

Briefinget, memót, kérdéslistát, cikkvázlatot, interjú-előkészítést vagy belső összefoglalót készít.

Emberi feladat

Megírja, szerkeszti, finomítja a narratívát, és vállalja a szakmai felelősséget.

Tipikus output

Szerkesztői briefing, cikkvázlat, outline, publikációs draft, belső memo.

Tipikus hibamód

Túl sima, de túl általános szöveg, bizonytalan állítások kimosása, látszólag kész, valójában review-éhes draft.

Trail & governance

Mit?

A kutatási útvonal, a review és a döntési pontok visszakövethető dokumentálása.

Mivel?

Notion, Google Docs, Google Sheets, Airtable

Hogyan?

Forrásnaplót, review státuszt és döntési logot vezetsz, hogy később is vissza lehessen nézni, melyik állítás miből, milyen promptból és milyen ellenőrzési körből került be.

Mire való

A kutatási útvonal, a review és a döntések visszakövethetőségének fenntartása.

Input

Promptok, források, screenshotok, review státuszok, verziók, uncertainty címkék.

AI szerepe

Segíthet logot rendezni, összefoglalni a kutatási lépéseket és annotált nyomvonalat fenntartani. Itt kell látszania, melyik állítás melyik linkből, PDF-ből vagy videórészletből jött.

Emberi feladat

Kijelöli, mi számít elfogadható bizonyítéknak, és fenntartja a governance szabályokat.

Tipikus output

Audit trail, forrásnapló, review státusz, publish / not publish döntési lánc.

Tipikus hibamód

Hiányzó source trace, eltűnő döntési pontok, log nélküli agenthasználat és később nem védhető állítások.

Döntési táblák

1. Feladat → AI-réteg / eszköztípus

Feladat	AI-réteg	Eszköztípus
90 perces videó bontása	Extraction	Gemini, NotebookLM, ChatGPT
Bejövő lead gyors előszűrése	Intake / triage	ChatGPT Projects, Claude
Nevek, cégek, összegek kigyűjtése	Extraction	Claude, ChatGPT, + táblázat/CSV
További registry- és webes nyomok keresése	Enrichment	Perplexity, browser agent, kézi registry-check
Források közti ellentmondások kiemelése	Verification	Claude, ChatGPT, + manuális source trace
Cikkvázlat vagy briefing készítése	Production	ChatGPT, Claude, + emberi review
Kutatási útvonal dokumentálása	Trail & governance	Notion, Google Docs, Google Sheets

2. Tool-választási döntési tábla

Helyzet	Eszköztípus	Mikor ezt válaszd
Gyors intake és összefoglalás	Okara, ChatGPT Projects, Claude, Gemini	Ha sok bejövő anyagból kell gyorsan eldönteni, mi érdemes mélyítésre. Érzékeny anyagnál előny a privát workspace vagy a no-training ígéret.
Multimodális feldolgozás	Pinpoint, NotebookLM, Gemini	Ha videóból, PDF-ből, screenshotból és webes anyagból kell egyszerre dolgozni, és dokumentumhalmazban kell keresni.
Entity és timeline extraction	Claude, ChatGPT, Sheets, Excel	Ha strukturálatlan inputból táblázható adatot, entitáslistát vagy idővonalat kell előállítani.
Böngészős adatgyűjtés	Playwright, browser agent, Tor Browser, manuális böngészés	Ha nincs API, sok a kattintás, és kontrollált UI-lépésekre van szükség örökségi registrykben, archive-oldalakon vagy érzékeny kutatási környezetben.
Scraping / parsing	Python, pandas, Playwright, requests, Codex, Copilot Agents	Ha ismétlődő webes vagy dokumentumkinyerési feladatot kell formalizálni és auditálhatóvá tenni.
Audit trail és kutatási memória	Notion, Google Docs, Google Sheets, Airtable	Ha fontos később visszanézni, melyik állítás honnan jött, mi lett megerősítve és mi maradt nyitott.
Végső szerkesztői output	ChatGPT, Claude, + emberi edit	Ha már ellenőrzött anyagból kell briefinget, memót, kérdéslistát vagy cikkvázlatot készíteni.

3. Lean / Standard / Advanced stack

Réteg	Lean	Standard	Advanced
Munkakörnyezet	1 újságíró vagy nagyon kis csapat, kézi source loggal	Kis-közepes newsroom vagy NGO research desk fix workflow-val	Investigative unit vagy research desk több párhuzamos üggyel
Fő eszköztípus	Okara, Claude, NotebookLM, Gemini, Sheets	Okara, Claude, ChatGPT, Pinpoint, NotebookLM, Python/pandas, Sheets, Airtable	Privát AI, Pinpoint, NotebookLM, Playwright, SpiderFoot, Maltego, Notion, Airtable
Mire elég	Videóösszefoglalás, alap extraction, kézi ellenőrzés, briefing	Félautomata extraction, timeline, entity tábla, rendszeres verification	Monitoring, állandó enrichment, browser taskok, auditálható kutatási folyamat
Emberi kontroll	Minden kritikus pont kézi review	Mintavételes és állításalapú review, plusz szerkesztői checkpoint	Formális approval gate-ek, uncertainty labeling, verzió- és trail-fegyelem
Tipikus kockázat	A summary-k túlértékelése	A scriptből vagy extractionből jövő mezők túlzott bizalma	Az agent- és browser-lépések kontrollvesztése log és sandbox nélkül

4. Human vs AI döntési tábla

Feladat	Ki dominál	Miért
Lead előszűrés	AI segíthet	Gyors beérkeztetési összefoglaló és témajelölés
Entity-lista első verziója	AI segíthet	Nyers kigyűjtés és normalizálás
Timeline első draftja	AI segíthet	Események strukturálása és dátumok rendezése
Primer forrás minősítése	Ember dönt	Bizonyítékszint és hitelesség nem delegálható
Végső fact-check	Ember dönt	Az AI nem automatikus fact-checker
Publikációs állítás megfogalmazása	Ember dönt	Jog, etika és kontextus miatt
Briefing vagy outline előkészítése	Közös munka	AI draftol, ember szerkeszt és vállal felelősséget

A lényeg ugyanaz marad: az AI nem forrás, nem bizonyíték, nem automatikus fact-checker.

Maturity modell: Lean / Standard / Advanced

Lean

Freelancer vagy kis szerkesztőség számára. A cél az előszűrés, a videó- és dokumentumbontás, az entity-lista és a briefing gyorsítása kézi source log mellett.

Standard

Kis-közepes newsroom vagy NGO/OSINT csapat számára. Már van fix extraction, strukturált adatkezelés, rendszeres review és többféle input kombinálása.

Advanced

Investigative unit vagy research desk számára. Tool-use, browser workflow, trail-management és formalizált approval gate-ek együtt adnak kontrollált gyorsulást.

Mit jelent ez nem-informatikusoknak?

A cél itt nem az, hogy fejlesztővé válj, hanem az, hogy használható kapcsolatod legyen azokhoz az eszközökhöz és munkafolyamatokhoz, amelyek korábban túl technikaiak voltak. Az AI segíthet repókat megérteni, egyszerű scripteket kérni, scraping-logikát előkészíteni és a kézi kutatást strukturáltabbá tenni.

Python nem-informatikusoknak

Nem az a cél, hogy fejlesztővé válj, hanem az, hogy meg tudd kérni az AI-t: írjon egy kis scriptet PDF-ek, CSV-k, céglisták vagy rekordok tisztítására és extractionjére.

GitHub mint eszközkönyvtár

A GitHub tele van az AI előtti világból maradt nyílt eszközökkel. Az AI segíthet megérteni, mire jó egy repo, hogyan kell futtatni, és mit tudsz belőle a saját ügyedre átvenni.

Nem mindent nulláról kell építeni

Sokszor elég egy meglévő scraper, parser, geolokációs vagy videóellenőrző eszköz mellé AI-t tenni, hogy használhatóvá váljon számodra.

Az AI itt hozzáférési réteg

A modell nem a bizonyítékot adja, hanem csökkenti a technikai belépési küszöböt olyan workflow-khoz, amelyek korábban túl bonyolultak voltak.

Konkrét eszközterek

AI research és dokumentumelemzés

Okara, Pinpoint, NotebookLM, Gemini, Claude, ChatGPT Projects

Nagy dokumentumhalmaz, transzkript, sajtóanyag, jegyzőkönyv és PDF gyors bontása, keresése és előszűrése.

AI-val támogatott OSINT útvonaltervezés

Perplexity, Claude, ChatGPT Projects, Bellingcat Toolkit, OSINT Framework

A megfelelő nyomozási útvonal és eszközkategória kiválasztása, amikor még nem világos, hogy reverse image, domain, geolocation vagy registry irány lesz a jó.

AI-val előkészített háló- és infrastruktúrakutatás

Claude, ChatGPT, SpiderFoot, Maltego, Shodan

Személy–cég–domain–IP–eszköz kapcsolatok feltérképezése, digitális lábnyomok és hálózati összefüggések vizsgálata AI-val előkészített kérdéslistákkal és entity-normalizálással.

AI-val támogatott kép- és videóellenőrzés

Gemini, Claude, InVID, Amnesty YouTube DataViewer, ExifTool

Kulcsképkockák, feltöltési időpontok, fordított képkeresés és metaadatok ellenőrzése deepfake- vagy félrevezető vizuális tartalom esetén, AI-val gyorsított első hipotézisalkotással.

További AI-eszközterek, amiket érdemes ismerni

A workflow-mag mellé érdemes látni még néhány olyan eszközteret is, amelyek tovább bővítik, hogy az AI-val pontosan mit és mivel lehet jobban csinálni ebben a munkában.

Nagy dokumentumhalmazoknál a dokumentumkeresés és a forrásalapú jegyzetelés erősíthető

A mostani modulban jó az extraction-logika, de érdemes erősebben megmutatni a dokumentumkollekció-szintű munkát is. A Google-féle Pinpoint kifejezetten újságíróknak készült nagy dokumentum-, hang- és képhalmazok keresésére, míg a NotebookLM a saját forrásaidból épít kontextust.

Mivel? Pinpoint, NotebookLM

Forrás: Google: Pinpoint AI funkciók újságíróknak

A GitHub és a kódolási agentek külön AI-képességtérként érdemesek megjelenni

Az oldal már említi a Python- és GitHub-vonalat, de ezt érdemes konkrétabbá tenni. A GitHub maga is forrás lehet, az AI-kódagentek pedig már képesek repókat olvasni, kódot módosítani és parancsokat futtatni, ami nem-informatikusoknak is lejjebb viszi a belépési küszöböt.

Mivel? GitHub Copilot Agents, OpenAI Codex, Octosuite

Forrás: OpenAI code generation guide

A vizuális és geotérbeli ellenőrzés bővíthető AI- és GeoAI-eszközökkel

A klasszikus vizuális verifikáció mellé ma már érdemes beemelni az AI-geolokáció és a természetes nyelvű geotérbeli keresés példáit is. Ez nem váltja ki a kézi ellenőrzést, de új nyomozási irányokat nyit.

Mivel? InVID Verification Plugin, GeoSpy, SPOT

Forrás: GeoSpy Pro

A háló- és infrastruktúrakutatásnál a kombinált stacket érdemes explicitebbé tenni

A jelenlegi modul említi a hálózati és infrastruktúra-vonalat, de érdemes jobban kimondani, hogy itt a valódi erő a kombinációban van: az AI előkészíti a kérdéseket és normalizálja az entitásokat, a SpiderFoot, a Maltego és a Shodan pedig más-más nézetből gazdagítják a képet.

Mivel? SpiderFoot, Maltego, Shodan

Forrás: SpiderFoot README

Gyakorlati use case-ek

Sajtótájékoztatóból szerkesztői briefing

Egy 90 perces videóból ki kell emelni a kulcsállításokat, a pénzügyi számokat, a szereplőket és a visszahallgatandó pontokat.

Mit?

Egy 90 perces videóból ki kell emelni a kulcsállításokat, a pénzügyi számokat, a szereplőket és a visszahallgatandó pontokat.

Mivel?

Gemini, NotebookLM, Google Docs

Hogyan?

Videófeltöltés → állításlista → timestamp-ellenőrzés → briefing

Workflow-lépések

1Töltsd fel a videót Gemini-be vagy NotebookLM-be.
2Kérj külön listát a szereplőkről, a számokról és a konkrét állításokról.
3Jelöld ki a 5–10 legkritikusabb állítást, és kézzel hallgasd vissza az időbélyegek alapján.
4A biztos állításokat vidd át egy briefingbe, a bizonytalanokat külön blokkba tedd.

Tipikus output: Timestampelt állításlista, ellenőrizendő számok, 8 pontos briefing, külön uncertainty-jelöléssel.

Közbeszerzési háló előkészítése

Tenderoldalakról és kapcsolódó PDF-ekből kell cégek, összegek, dátumok és partnerkapcsolatok első listáját felépíteni.

Mit?

Tenderoldalakról és kapcsolódó PDF-ekből kell cégek, összegek, dátumok és partnerkapcsolatok első listáját felépíteni.

Mivel?

Claude, ChatGPT, Google Sheets, Perplexity

Hogyan?

PDF extraction → táblás normalizálás → háttérkutatás → registry-check

Workflow-lépések

1Extractáld a PDF-ekből a cégeket, összegeket, dátumokat és tenderazonosítókat.
2Rendezd egységes táblába a rekordokat Sheetsben.
3Perplexityvel kérj háttérkutatási irányokat a cégekre és a kulcsszereplőkre.
4Minden fontos rekordot ellenőrizz vissza cégjegyzékben vagy hivatalos forrásban.

Tipikus output: CSV vagy táblázat, entity normalizálás, első timeline és a kézi ellenőrzést igénylő rekordok listája.

Lead triage kis newsroomban

Hetente több tipp, email és dokumentum érkezik, de kevés ember jut az első körös értékelésre.

Mit?

Hetente több tipp, email és dokumentum érkezik, de kevés ember jut az első körös értékelésre.

Mivel?

Okara, ChatGPT Projects, Sheets, Notion

Hogyan?

Lead-begyűjtés → intake-summary → priorizálás → scope-döntés

Workflow-lépések

1Minden beérkező emailből, PDF-ből és linkből készíts rövid intake-summaryt.
2A summaryk alapján címkézd a leadeket: breaking, háttér, későbbre parkolható.
3A legígéretesebb ügyekhez írasd ki azonnal a nyitott kérdéseket és a hiányzó adatokat.
4Az emberi szerkesztő döntse el, melyik ügyből lesz valódi kutatás.

Tipikus output: Scope-olt backlog, kutatási prioritások, nyitott kérdések és gyors kockázati címkézés.

Legacy registry böngészős bejárása

Sok kattintásos, API nélküli nyilvántartásból kell standard mezőket kigyűjteni több szereplőre.

Mit?

Sok kattintásos, API nélküli nyilvántartásból kell standard mezőket kigyűjteni több szereplőre.

Mivel?

Playwright, browser agent, Sheets

Hogyan?

Böngészés → rekordgyűjtés → naplózás → exception review

Workflow-lépések

1Határozd meg előre a kigyűjtendő mezőket és a kivételek listáját.
2Playwrighttal vagy kézi lépésekkel gyűjtsd ki a rekordokat ugyanabban a sorrendben.
3Minden rekordhoz ments linket vagy screenshotot, hogy később visszaellenőrizhető legyen.
4A sikertelen vagy bizonytalan találatokat külön exception queue-ba tedd kézi ellenőrzésre.

Tipikus output: Strukturált mezőlista, screenshot-trail, hibalog és exception queue a kézi visszaadásra.

QC / verification / governance

Ez az a réteg, ahol eldől, hogy az AI által előállított köztes anyagból lesz-e valóban védhető szerkesztőségi munka. Nem elég a gyors summary vagy az entity-lista: kell forrásnyomvonal, uncertainty-jelölés, emberi review és visszakereshető döntési út is.

Forrásnyomvonal

Minden állítás mögött legyen primer vagy ellenőrizhető másodlagos forrás, és külön jelölve legyen, ha valami csak AI-köztes jegyzet.

Bizonyossági címkézés

Minden fontos rekord vagy állítás kapjon bizonyossági státuszt: confirmed, plausible but unverified, contradicted vagy unknown. Ezt érdemes külön oszlopban vezetni a táblában.

Emberi kontrollpontok

Kritikus pontokon kötelező legyen a kézi ellenőrzés: extraction után, publikáció előtt, és érzékeny jogi állításoknál külön review-ban.

Audit trail

Legyen visszakereshető, mit nézett meg az AI, milyen prompt ment ki, mely források jöttek vissza és mi lett elfogadva vagy elvetve.

Gyors checklist

✓A cikkbe vagy briefingbe kerülő minden kritikus állításnak van visszakövethető forrása.
✓Az uncertainty-jelölések nem vesztek el a production rétegben.
✓A videóból vagy transzkriptből vett idézetek vissza lettek hallgatva vagy ellenőrizve.
✓A scriptből, extractionből vagy browser-lépésből jövő rekordok legalább mintavételesen át lettek nézve.
✓A publikációs döntés előtt a humán reviewer külön végigment a bizonyítékszinten.

Korlátok és failure mode-ok

–Hallucináció: a modell magabiztosan állít olyat is, amit nem tud bizonyítani.
–Rossz forrásértelmezés: összefüggést lát ott is, ahol csak közelség vagy véletlen együttállás van.
–OCR- és transzkripthibák: rossz név, rossz dátum vagy rossz összeg bekerül a struktúrába.
–Böngésző-automatizálás törékenysége: captcha, layoutváltás, dinamikus tartalom vagy prompt injection.
–Túl sima szerkesztői draft: a szöveg jónak tűnik, de a mögöttes bizonyítékszint gyenge.
–Trail hiánya: később nem védhető, hogy egy állítás melyik forrásláncon jutott be a sztoriba.

Ami elsőre kimarad

→A forrásnapló és a kutatási nyomvonal legalább olyan fontos, mint maga az AI-eszköz.
→Az emberi ellenőrzés nem a végére odabiggyesztett formalitás, hanem külön munkaréteg.
→A jó stack nem azonos a 'legerősebb modellel' - sokszor a szervezettség többet számít, mint a nyers modellképesség.
→A videó- vagy PDF-összefoglaló sosem egyenlő a primer forrással. Idézni csak visszahallgatás és ellenőrzés után szabad.
→A böngészős vagy scraperes workflow csak akkor hoz értéket, ha a hibakezelés, a naplózás és az exception queue is meg van tervezve.

Döntési keret

Érdemes, ha

✓Sok a repetitív kutatási feladat, és a csapat ideje a bottleneck.
✓Rendszeresen dolgoztok videóval, PDF-fel, registry-anyagokkal vagy nagy URL-halmazokkal.
✓Van legalább alapvető forrásfegyelem és hajlandóság a logolásra.
✓A cél nem varázslat, hanem gyorsabb beérkeztetés, adatkinyerés és ellenőrzés.

Korai vagy rossz fit, ha

–Nincs standard kutatási folyamat, csak alkalmi improvizáció.
–Nincs kijelölt ember, aki a review-t és a source quality-t viszi.
–Érzékeny ügyben teljes automatizmust akartok human gate nélkül.
–A csapat a modellt elsődleges bizonyítási rétegként szeretné kezelni.

Mód	Mikor elég / mikor kell
Sima chat	Kevés ügy, kevés input, gyors manuális kutatássegítés
Multimodális modell	Videó, PDF és URL egyszerre fontos input
Script + kódfuttatás réteg	Ismétlődő adatkinyerési vagy parsing feladat van
Böngészős / tool-use réteg	Sok kattintásos, API nélküli workflow-t kell bejárni
Trail / governance réteg	Később is védeni kell a forrásláncot és a döntési utat

Építs saját workflow-t

1Válassz ki 1 videós, 1 dokumentumos és 1 webes kutatási feladatot, amit tényleg ismételtek.
2Írd le külön, hol van intake, triage, extraction, enrichment, verification és production a jelenlegi folyamatban.
3Jelöld ki, melyik lépésnél segít az AI, és melyik pont marad kizárólag emberi review.
4Rögzíts fix outputformákat: entity tábla, timeline, fact sheet, briefing.
5Vezess be uncertainty-jelölést és source logot már a pilotban.
6Csak akkor mélyíts browser- vagy agentirányba, ha a kisebb pilot már reprodukálható és auditálható.

Kapcsolódó oldalak

workflow

Workflow

foundation

Multimodális AI

concept

Agentek és browser agentek

model

Perplexity

foundation

Automatizáció

foundation

Governance

← Vissza a szakmai modulokhoz