← Szakmai modulok
🔍 Kutatás modulHaladó~55 perc

AI az újságírásban és az OSINT-ban

Ez a modul azt mutatja meg, hogyan épül be az AI az oknyomozó újságírás és az OSINT valós munkafolyamataiba. Nem AI-alapozó és nem általános newsroom-útmutató, hanem egy gyakorlati, workflow-alapú deep-dive arról, hogyan használható az AI kutatási, ellenőrzési és publikációs munkában időnyereségre és jobb munkaszervezésre.

Pozicionálás: Az AI nem forrás, nem bizonyíték, nem automatikus fact-checker, hanem kutatási gyorsító és operációs réteg.
7 workflow-réteg

Intake-től a trail és governance rétegig

4 döntési tábla

Feladathoz, stackhez és emberi kontrollhoz

1 hosszú modul

Nem külön leckék, hanem egy összefüggő rendszer

Vezetői összefoglaló

Az AI ott ad valódi értéket, ahol túl sok a forrás, túl sok a zaj, túl sok a formátum, és túl kevés az idő.

Az újságírói és OSINT munka fő nyeresége nem az, hogy az AI helyetted 'megmondja az igazat', hanem az, hogy előszűr, strukturál, kapcsolatokat emel ki, és gyorsabban visz el az ellenőrizhető állításokig.

A legnagyobb hiba az AI-t forrásként kezelni. A helyes modell az, hogy az AI segít keresni, bontani, szűrni, összekötni, priorizálni és előkészíteni.

A működő rendszer mindig több rétegből áll: beérkeztetés, előszűrés, adatkinyerés, dúsítás, ellenőrzés, szerkesztői előállítás, nyomvonal és governance.

A jó implementáció nem terméklista, hanem olyan workflow, ahol világos, mi az AI feladata, mi az emberé, és hogyan marad visszakövethető minden kritikus döntés.

Kiknek szól

Oknyomozó újságírók

Akik sok dokumentummal, videóval, nyilatkozattal és kapcsolati hálóval dolgoznak, és az előszűrésben, rendszerezésben akarnak gyorsulni.

OSINT-kutatók

Akik nyílt forrásokból építenek dossziékat, entity-listákat, idővonalakat és összefüggésrendszereket.

Fact-checkerek és research deskek

Akiknek nem a kreatív szöveg a fő feladatuk, hanem az állítások bizonyítékszintjének gyors és fegyelmezett kezelése.

Newsroom szerkesztők

Akik azt akarják eldönteni, hol hoz valódi időnyereséget az AI a kutatásban, és hol kell megmaradnia az emberi ellenőrzésnek.

Helyes mentális modell

Az AI nem igazságmotor. Az AI kutatási gyorsító és operációs réteg, amely előkészíti a munkát, de nem váltja ki a forrásminősítést, a szerkesztői ítéletet vagy a bizonyítási felelősséget.

Rossz modell

  • Bedobom a kérdést, és majd a modell megmondja, mi igaz.
  • Ha a modell összefoglalta, akkor a summary már publikációképes.
  • Ha az AI talált kapcsolatot, akkor az már bizonyított kapcsolat.

Helyes modell

  • A modell előszűr, strukturál és priorizál.
  • Az ember ellenőriz, összevet, minősít és dönt.
  • A publikációs állítások mögött mindig visszakereshető forráslánc kell.

Miért számít a gyakorlatban

A modern szerkesztőség fő szűk keresztmetszete gyakran nem az információ hiánya, hanem a feldolgozhatatlan mennyiség.

Videók, PDF-ek, közlemények, cégadatok, webes nyomok és archív anyagok együtt kezelése ma már multimodális workflow-feladat.

Az időnyereség önmagában kevés: a visszakövethetőség, az uncertainty-jelölés és a humán review ugyanilyen fontos.

Aki csak chatként használja az AI-t, az a felszíni gyorsulást kapja meg. Aki privacy-tudatos, hibrid workflow-rétegként használja, az szerkesztőségi vagy kutatási kapacitást nyer.

Az AI új képességtereket is megnyit: olyan nyílt forrású eszközök, Python-scriptek és GitHub-repók is használhatóvá válnak, amelyekhez korábban fejlesztői belépő kellett.

Kontextus és lehetőségtér

Ez a modul nem az AI-alapokról szól, hanem arról, hogy egy már ismert technológiát hogyan illesztesz be valós kutatási munkába. Itt minden blokkot úgy kell olvasni, hogy a fókusz az AI használati lehetőségein van: ha megjelenik egy nem-AI eszköz vagy workflow, az csak azért szerepel, mert az AI-val együtt lesz belőle gyorsabb, jobb vagy hozzáférhetőbb munkafolyamat.

A legnagyobb váltás nem az, hogy az AI gyorsabban összefoglal egy PDF-et, hanem az, hogy hozzáférési réteggé válik korábban technikai workflow-khoz is. Így nem csak dokumentumokat, hanem webes adatot, táblákat, kódot, nyílt repókat, geolokációs nyomokat és vizuális ellenőrzési feladatokat is közelebb hoz.

Kutatási kérdés / lead

Mi a kutatási kérdés, hipotézis vagy tipp, amivel a munka indul?

Források / bizonyítékok

Videó, URL, PDF, cégjegyzék, social nyom, archív anyag, táblázat vagy transzkript.

AI-feldolgozás

Összefoglalás, extraction, enrichment, scriptváz, mintázatjelölés, idővonal és entitáslista.

Emberi review

Forráskritika, ellentmondások kezelése, bizonyítékszint és publikációs kockázat megítélése.

Szerkesztői output

Briefing, memo, fact sheet, timeline, kérdéslista, cikkvázlat vagy kézirat-előkészítés.

Nyomvonal / governance

Forráslánc, uncertainty flag, review státusz, verzió és audit trail.

  • Python-scriptek írása és módosítása egyszerű extraction vagy tisztítási feladatokra
  • GitHub-repók megértése és futtatási belépőpontjainak feltárása
  • Scraper-ek, parser-ek és adatkinyerők adaptálása saját ügyre
  • CSV- és Excel-tisztítás, duplikációkezelés, oszlopnormalizálás
  • Geolokációs segédeszközök és vizuális ellenőrző workflow-k használata
  • Videó- és képkocka-alapú ellenőrzési munkafolyamatok előkészítése

A 7 workflow-réteg

1

Beérkeztetés

Mit?

A bejövő lead, dokumentum, videó vagy linkhalmaz első értelmezése és scope-olása.

Hogyan?

Feltöltöd vagy bemásolod a nyers inputot, kérsz egy rövid intake-summaryt, kulcsállítás-listát és nyitott kérdéseket, majd emberként eldöntöd, hogy ez valódi ügy-e vagy csak háttérzaj.

Mire való

A bejövő tipp, dokumentum, videó vagy kutatási kérdés rendezett fogadása.

Input

Email, üzenet, PDF, nyilvános videó, URL-gyűjtemény, táblázat, archív anyag.

AI szerepe

Gyors első összefoglaló, témacímkézés, explicit állítások és nyitott kérdések kiemelése. Például: egy 40 oldalas PDF-ből 8 pontos intake-jegyzet.

Emberi feladat

Eldönti, hogy a téma egyáltalán kutatásra érdemes-e, és milyen bizonyítékszintet igényel. Itt dől el az is, hogy breaking, háttéranyag vagy hosszabb ügy lesz belőle.

Tipikus output

Rövid intake note, kutatási kérdés, scope, hiányzó inputok listája.

Tipikus hibamód

Rosszul értelmezett lead, félreolvasott brief, túl korai túlértékelés vagy téves priorizálás.

2

Előszűrés

Mit?

A zaj és a releváns nyomok szétválasztása, valamint az első három kutatási irány kijelölése.

Hogyan?

A modell segítségével priorizálod a linkeket, dokumentumokat és szereplőket, majd kézzel kiválasztod, melyik szál kap időt, és melyik marad parkolópályán.

Mire való

A zaj és a releváns nyomok szétválasztása, az elsődleges irányok kijelölése.

Input

Első forráslista, nyers dokumentumhalmaz, több URL, transcript, screenshot, tippek.

AI szerepe

Tematizálás, duplikátumok észlelése, ellentmondásgyanús pontok jelölése, első prioritási lista. Például: melyik 3 linket nézd meg először a 20 közül.

Emberi feladat

Eldönti, melyik szál kapjon időt, mi marad háttérben, és hol kell azonnali kézi ellenőrzés.

Tipikus output

Prioritási lista, kutatási backlog, első munkahipotézisek.

Tipikus hibamód

Releváns szálak elvesztése, hamis pozitív kapcsolatok, túl sok zaj bent hagyása a következő körre.

3

Adatkinyerés

Mit?

Strukturálatlan anyagból kinyerhető név-, cég-, dátum-, összeg- és állításlista készítése.

Hogyan?

Feldolgoztatod a videót, PDF-et vagy OCR-anyagot, táblás formátumot kérsz, majd mintavételesen kézzel ellenőrzöd a kritikus mezőket, mielőtt ráépítesz a kimenetre.

Mire való

Strukturálatlan anyagból strukturált adat készítése.

Input

Videó, PDF, weboldal, OCR-ezett scan, transzkript, hosszú cikk, adatdump.

AI szerepe

Nevek, cégek, összegek, helyek, idézetek, állítások, szereplők és események kigyűjtése. Jó célformátum: Sheets-tábla vagy CSV.

Emberi feladat

Mintát ellenőriz, megnézi a kritikus mezőket, és eldönti, hogy a struktúra valóban használható-e.

Tipikus output

Entity tábla, timeline, állításlista, idézetjegyzék, strukturált CSV vagy JSON.

Tipikus hibamód

OCR-hibák, félreértett nevek, rossz időpontok, kiragadott idézetek, hibás mező-normalizálás.

4

Dúsítás

Mit?

A már kinyert entitások és időpontok kibővítése további nyílt forrású nyomokkal.

Hogyan?

Az entity-listából kiindulva új keresési köröket indítasz, registryket, archívumokat, hálózati nyomokat és kapcsolódó domaineket nézel meg, miközben az AI a következő kérdéseket és összekötéseket javasolja.

Mire való

Az alapvető adatpontok kibővítése további nyílt forrásokkal és keresési lépésekkel.

Input

Entity lista, domain, cég, személy, idővonal, dokumentumhivatkozások, registry linkek.

AI szerepe

Javaslatot tesz további keresésekre, összekapcsolja a forrásokat, scriptvázat ír, vagy segít böngészős munkafolyamatot előkészíteni. Például: registry, archive.org, cégadatbázis, LinkedIn-céglap.

Emberi feladat

Felügyeli a keresési irányt, ellenőrzi a kritikus összekötéseket, és féken tartja a spekulációt.

Tipikus output

Bővített dosszié, kapcsolati háló, enriched entity rekordok, új ellenőrizendő szálak.

Tipikus hibamód

Összefüggés és okság összekeverése, rossz entitás-összevezetés, prompt injection vagy webes zaj túlértékelése.

5

Ellenőrzés

Mit?

Az állítások bizonyítékszintjének, forrásláncának és ellentmondásainak ellenőrzése.

Hogyan?

Összeveted a forrásokat, külön címkézed a biztos és bizonytalan állításokat, a vizuális elemeket klasszikus verifikációs eszközökkel is ellenőrzöd, és csak azután engeded tovább az anyagot.

Mire való

Az állítások bizonyítékszintjének és forrásláncának szigorú ellenőrzése.

Input

Állításlista, forráslánc, idézetek, enriched dosszié, timeline, archive snapshot.

AI szerepe

Segít összevetni a forrásokat, jelöli az ellentmondásokat, bizonytalansági címkét ad és ellenőrzőlistát készít.

Emberi feladat

A végső forrásminősítés, visszahallgatás, kézi registry-check és publikálhatósági döntés kizárólag emberi feladat.

Tipikus output

Confirmed / plausible / contradicted / unknown jelölés, fact sheet, ellenőrzési lista.

Tipikus hibamód

Az AI forrásként kezelése, hamis biztonságérzet, ellenőrizetlen secondary summary-k publikációs használata.

6

Szerkesztői előállítás

Mit?

Az ellenőrzött anyag briefinggé, kérdéslistává, cikkvázlattá vagy belső memóvá alakítása.

Hogyan?

Az AI-val elkészíted az első szerkesztői draftot vagy briefinget, majd emberként tisztítod a narratívát, visszateszed a bizonyítékszinteket, és eldöntöd, mi publikálható.

Mire való

Az ellenőrzött anyag szerkesztőségi vagy kutatási outputtá alakítása.

Input

Review-zott jegyzetek, fact sheet, entity tábla, timeline, kulcsidézetek, angle.

AI szerepe

Briefinget, memót, kérdéslistát, cikkvázlatot, interjú-előkészítést vagy belső összefoglalót készít.

Emberi feladat

Megírja, szerkeszti, finomítja a narratívát, és vállalja a szakmai felelősséget.

Tipikus output

Szerkesztői briefing, cikkvázlat, outline, publikációs draft, belső memo.

Tipikus hibamód

Túl sima, de túl általános szöveg, bizonytalan állítások kimosása, látszólag kész, valójában review-éhes draft.

7

Trail & governance

Mit?

A kutatási útvonal, a review és a döntési pontok visszakövethető dokumentálása.

Hogyan?

Forrásnaplót, review státuszt és döntési logot vezetsz, hogy később is vissza lehessen nézni, melyik állítás miből, milyen promptból és milyen ellenőrzési körből került be.

Mire való

A kutatási útvonal, a review és a döntések visszakövethetőségének fenntartása.

Input

Promptok, források, screenshotok, review státuszok, verziók, uncertainty címkék.

AI szerepe

Segíthet logot rendezni, összefoglalni a kutatási lépéseket és annotált nyomvonalat fenntartani. Itt kell látszania, melyik állítás melyik linkből, PDF-ből vagy videórészletből jött.

Emberi feladat

Kijelöli, mi számít elfogadható bizonyítéknak, és fenntartja a governance szabályokat.

Tipikus output

Audit trail, forrásnapló, review státusz, publish / not publish döntési lánc.

Tipikus hibamód

Hiányzó source trace, eltűnő döntési pontok, log nélküli agenthasználat és később nem védhető állítások.

Döntési táblák

1. Feladat → AI-réteg / eszköztípus

FeladatAI-rétegEszköztípus
90 perces videó bontásaExtractionGemini, NotebookLM, ChatGPT
Bejövő lead gyors előszűréseIntake / triageChatGPT Projects, Claude
Nevek, cégek, összegek kigyűjtéseExtractionClaude, ChatGPT, + táblázat/CSV
További registry- és webes nyomok kereséseEnrichmentPerplexity, browser agent, kézi registry-check
Források közti ellentmondások kiemeléseVerificationClaude, ChatGPT, + manuális source trace
Cikkvázlat vagy briefing készítéseProductionChatGPT, Claude, + emberi review
Kutatási útvonal dokumentálásaTrail & governanceNotion, Google Docs, Google Sheets

2. Tool-választási döntési tábla

HelyzetEszköztípusMikor ezt válaszd
Gyors intake és összefoglalásOkara, ChatGPT Projects, Claude, GeminiHa sok bejövő anyagból kell gyorsan eldönteni, mi érdemes mélyítésre. Érzékeny anyagnál előny a privát workspace vagy a no-training ígéret.
Multimodális feldolgozásPinpoint, NotebookLM, GeminiHa videóból, PDF-ből, screenshotból és webes anyagból kell egyszerre dolgozni, és dokumentumhalmazban kell keresni.
Entity és timeline extractionClaude, ChatGPT, Sheets, ExcelHa strukturálatlan inputból táblázható adatot, entitáslistát vagy idővonalat kell előállítani.
Böngészős adatgyűjtésPlaywright, browser agent, Tor Browser, manuális böngészésHa nincs API, sok a kattintás, és kontrollált UI-lépésekre van szükség örökségi registrykben, archive-oldalakon vagy érzékeny kutatási környezetben.
Scraping / parsingPython, pandas, Playwright, requests, Codex, Copilot AgentsHa ismétlődő webes vagy dokumentumkinyerési feladatot kell formalizálni és auditálhatóvá tenni.
Audit trail és kutatási memóriaNotion, Google Docs, Google Sheets, AirtableHa fontos később visszanézni, melyik állítás honnan jött, mi lett megerősítve és mi maradt nyitott.
Végső szerkesztői outputChatGPT, Claude, + emberi editHa már ellenőrzött anyagból kell briefinget, memót, kérdéslistát vagy cikkvázlatot készíteni.

3. Lean / Standard / Advanced stack

RétegLeanStandardAdvanced
Munkakörnyezet1 újságíró vagy nagyon kis csapat, kézi source loggalKis-közepes newsroom vagy NGO research desk fix workflow-valInvestigative unit vagy research desk több párhuzamos üggyel
Fő eszköztípusOkara, Claude, NotebookLM, Gemini, SheetsOkara, Claude, ChatGPT, Pinpoint, NotebookLM, Python/pandas, Sheets, AirtablePrivát AI, Pinpoint, NotebookLM, Playwright, SpiderFoot, Maltego, Notion, Airtable
Mire elégVideóösszefoglalás, alap extraction, kézi ellenőrzés, briefingFélautomata extraction, timeline, entity tábla, rendszeres verificationMonitoring, állandó enrichment, browser taskok, auditálható kutatási folyamat
Emberi kontrollMinden kritikus pont kézi reviewMintavételes és állításalapú review, plusz szerkesztői checkpointFormális approval gate-ek, uncertainty labeling, verzió- és trail-fegyelem
Tipikus kockázatA summary-k túlértékeléseA scriptből vagy extractionből jövő mezők túlzott bizalmaAz agent- és browser-lépések kontrollvesztése log és sandbox nélkül

4. Human vs AI döntési tábla

FeladatKi dominálMiért
Lead előszűrésAI segíthetGyors beérkeztetési összefoglaló és témajelölés
Entity-lista első verziójaAI segíthetNyers kigyűjtés és normalizálás
Timeline első draftjaAI segíthetEsemények strukturálása és dátumok rendezése
Primer forrás minősítéseEmber döntBizonyítékszint és hitelesség nem delegálható
Végső fact-checkEmber döntAz AI nem automatikus fact-checker
Publikációs állítás megfogalmazásaEmber döntJog, etika és kontextus miatt
Briefing vagy outline előkészítéseKözös munkaAI draftol, ember szerkeszt és vállal felelősséget

A lényeg ugyanaz marad: az AI nem forrás, nem bizonyíték, nem automatikus fact-checker.

Maturity modell: Lean / Standard / Advanced

Lean

Freelancer vagy kis szerkesztőség számára. A cél az előszűrés, a videó- és dokumentumbontás, az entity-lista és a briefing gyorsítása kézi source log mellett.

Standard

Kis-közepes newsroom vagy NGO/OSINT csapat számára. Már van fix extraction, strukturált adatkezelés, rendszeres review és többféle input kombinálása.

Advanced

Investigative unit vagy research desk számára. Tool-use, browser workflow, trail-management és formalizált approval gate-ek együtt adnak kontrollált gyorsulást.

Mit jelent ez nem-informatikusoknak?

A cél itt nem az, hogy fejlesztővé válj, hanem az, hogy használható kapcsolatod legyen azokhoz az eszközökhöz és munkafolyamatokhoz, amelyek korábban túl technikaiak voltak. Az AI segíthet repókat megérteni, egyszerű scripteket kérni, scraping-logikát előkészíteni és a kézi kutatást strukturáltabbá tenni.

Python nem-informatikusoknak

Nem az a cél, hogy fejlesztővé válj, hanem az, hogy meg tudd kérni az AI-t: írjon egy kis scriptet PDF-ek, CSV-k, céglisták vagy rekordok tisztítására és extractionjére.

GitHub mint eszközkönyvtár

A GitHub tele van az AI előtti világból maradt nyílt eszközökkel. Az AI segíthet megérteni, mire jó egy repo, hogyan kell futtatni, és mit tudsz belőle a saját ügyedre átvenni.

Nem mindent nulláról kell építeni

Sokszor elég egy meglévő scraper, parser, geolokációs vagy videóellenőrző eszköz mellé AI-t tenni, hogy használhatóvá váljon számodra.

Az AI itt hozzáférési réteg

A modell nem a bizonyítékot adja, hanem csökkenti a technikai belépési küszöböt olyan workflow-khoz, amelyek korábban túl bonyolultak voltak.

Konkrét eszközterek

AI research és dokumentumelemzés

Okara, Pinpoint, NotebookLM, Gemini, Claude, ChatGPT Projects

Nagy dokumentumhalmaz, transzkript, sajtóanyag, jegyzőkönyv és PDF gyors bontása, keresése és előszűrése.

AI-val támogatott OSINT útvonaltervezés

Perplexity, Claude, ChatGPT Projects, Bellingcat Toolkit, OSINT Framework

A megfelelő nyomozási útvonal és eszközkategória kiválasztása, amikor még nem világos, hogy reverse image, domain, geolocation vagy registry irány lesz a jó.

AI-val előkészített háló- és infrastruktúrakutatás

Claude, ChatGPT, SpiderFoot, Maltego, Shodan

Személy–cég–domain–IP–eszköz kapcsolatok feltérképezése, digitális lábnyomok és hálózati összefüggések vizsgálata AI-val előkészített kérdéslistákkal és entity-normalizálással.

AI-val támogatott kép- és videóellenőrzés

Gemini, Claude, InVID, Amnesty YouTube DataViewer, ExifTool

Kulcsképkockák, feltöltési időpontok, fordított képkeresés és metaadatok ellenőrzése deepfake- vagy félrevezető vizuális tartalom esetén, AI-val gyorsított első hipotézisalkotással.

További AI-eszközterek, amiket érdemes ismerni

A workflow-mag mellé érdemes látni még néhány olyan eszközteret is, amelyek tovább bővítik, hogy az AI-val pontosan mit és mivel lehet jobban csinálni ebben a munkában.

Nagy dokumentumhalmazoknál a dokumentumkeresés és a forrásalapú jegyzetelés erősíthető

A mostani modulban jó az extraction-logika, de érdemes erősebben megmutatni a dokumentumkollekció-szintű munkát is. A Google-féle Pinpoint kifejezetten újságíróknak készült nagy dokumentum-, hang- és képhalmazok keresésére, míg a NotebookLM a saját forrásaidból épít kontextust.

Mivel? Pinpoint, NotebookLM

Forrás: Google: Pinpoint AI funkciók újságíróknak

A GitHub és a kódolási agentek külön AI-képességtérként érdemesek megjelenni

Az oldal már említi a Python- és GitHub-vonalat, de ezt érdemes konkrétabbá tenni. A GitHub maga is forrás lehet, az AI-kódagentek pedig már képesek repókat olvasni, kódot módosítani és parancsokat futtatni, ami nem-informatikusoknak is lejjebb viszi a belépési küszöböt.

Mivel? GitHub Copilot Agents, OpenAI Codex, Octosuite

Forrás: OpenAI code generation guide

A vizuális és geotérbeli ellenőrzés bővíthető AI- és GeoAI-eszközökkel

A klasszikus vizuális verifikáció mellé ma már érdemes beemelni az AI-geolokáció és a természetes nyelvű geotérbeli keresés példáit is. Ez nem váltja ki a kézi ellenőrzést, de új nyomozási irányokat nyit.

Mivel? InVID Verification Plugin, GeoSpy, SPOT

Forrás: GeoSpy Pro

A háló- és infrastruktúrakutatásnál a kombinált stacket érdemes explicitebbé tenni

A jelenlegi modul említi a hálózati és infrastruktúra-vonalat, de érdemes jobban kimondani, hogy itt a valódi erő a kombinációban van: az AI előkészíti a kérdéseket és normalizálja az entitásokat, a SpiderFoot, a Maltego és a Shodan pedig más-más nézetből gazdagítják a képet.

Mivel? SpiderFoot, Maltego, Shodan

Forrás: SpiderFoot README

Gyakorlati use case-ek

Sajtótájékoztatóból szerkesztői briefing

Egy 90 perces videóból ki kell emelni a kulcsállításokat, a pénzügyi számokat, a szereplőket és a visszahallgatandó pontokat.

Mit?

Egy 90 perces videóból ki kell emelni a kulcsállításokat, a pénzügyi számokat, a szereplőket és a visszahallgatandó pontokat.

Hogyan?

Videófeltöltés → állításlista → timestamp-ellenőrzés → briefing

Workflow-lépések

  1. 1Töltsd fel a videót Gemini-be vagy NotebookLM-be.
  2. 2Kérj külön listát a szereplőkről, a számokról és a konkrét állításokról.
  3. 3Jelöld ki a 5–10 legkritikusabb állítást, és kézzel hallgasd vissza az időbélyegek alapján.
  4. 4A biztos állításokat vidd át egy briefingbe, a bizonytalanokat külön blokkba tedd.

Tipikus output: Timestampelt állításlista, ellenőrizendő számok, 8 pontos briefing, külön uncertainty-jelöléssel.

Közbeszerzési háló előkészítése

Tenderoldalakról és kapcsolódó PDF-ekből kell cégek, összegek, dátumok és partnerkapcsolatok első listáját felépíteni.

Mit?

Tenderoldalakról és kapcsolódó PDF-ekből kell cégek, összegek, dátumok és partnerkapcsolatok első listáját felépíteni.

Hogyan?

PDF extraction → táblás normalizálás → háttérkutatás → registry-check

Workflow-lépések

  1. 1Extractáld a PDF-ekből a cégeket, összegeket, dátumokat és tenderazonosítókat.
  2. 2Rendezd egységes táblába a rekordokat Sheetsben.
  3. 3Perplexityvel kérj háttérkutatási irányokat a cégekre és a kulcsszereplőkre.
  4. 4Minden fontos rekordot ellenőrizz vissza cégjegyzékben vagy hivatalos forrásban.

Tipikus output: CSV vagy táblázat, entity normalizálás, első timeline és a kézi ellenőrzést igénylő rekordok listája.

Lead triage kis newsroomban

Hetente több tipp, email és dokumentum érkezik, de kevés ember jut az első körös értékelésre.

Mit?

Hetente több tipp, email és dokumentum érkezik, de kevés ember jut az első körös értékelésre.

Hogyan?

Lead-begyűjtés → intake-summary → priorizálás → scope-döntés

Workflow-lépések

  1. 1Minden beérkező emailből, PDF-ből és linkből készíts rövid intake-summaryt.
  2. 2A summaryk alapján címkézd a leadeket: breaking, háttér, későbbre parkolható.
  3. 3A legígéretesebb ügyekhez írasd ki azonnal a nyitott kérdéseket és a hiányzó adatokat.
  4. 4Az emberi szerkesztő döntse el, melyik ügyből lesz valódi kutatás.

Tipikus output: Scope-olt backlog, kutatási prioritások, nyitott kérdések és gyors kockázati címkézés.

Legacy registry böngészős bejárása

Sok kattintásos, API nélküli nyilvántartásból kell standard mezőket kigyűjteni több szereplőre.

Mit?

Sok kattintásos, API nélküli nyilvántartásból kell standard mezőket kigyűjteni több szereplőre.

Mivel?

Playwright, browser agent, Sheets

Hogyan?

Böngészés → rekordgyűjtés → naplózás → exception review

Workflow-lépések

  1. 1Határozd meg előre a kigyűjtendő mezőket és a kivételek listáját.
  2. 2Playwrighttal vagy kézi lépésekkel gyűjtsd ki a rekordokat ugyanabban a sorrendben.
  3. 3Minden rekordhoz ments linket vagy screenshotot, hogy később visszaellenőrizhető legyen.
  4. 4A sikertelen vagy bizonytalan találatokat külön exception queue-ba tedd kézi ellenőrzésre.

Tipikus output: Strukturált mezőlista, screenshot-trail, hibalog és exception queue a kézi visszaadásra.

QC / verification / governance

Ez az a réteg, ahol eldől, hogy az AI által előállított köztes anyagból lesz-e valóban védhető szerkesztőségi munka. Nem elég a gyors summary vagy az entity-lista: kell forrásnyomvonal, uncertainty-jelölés, emberi review és visszakereshető döntési út is.

Forrásnyomvonal

Minden állítás mögött legyen primer vagy ellenőrizhető másodlagos forrás, és külön jelölve legyen, ha valami csak AI-köztes jegyzet.

Bizonyossági címkézés

Minden fontos rekord vagy állítás kapjon bizonyossági státuszt: confirmed, plausible but unverified, contradicted vagy unknown. Ezt érdemes külön oszlopban vezetni a táblában.

Emberi kontrollpontok

Kritikus pontokon kötelező legyen a kézi ellenőrzés: extraction után, publikáció előtt, és érzékeny jogi állításoknál külön review-ban.

Audit trail

Legyen visszakereshető, mit nézett meg az AI, milyen prompt ment ki, mely források jöttek vissza és mi lett elfogadva vagy elvetve.

Gyors checklist

  • A cikkbe vagy briefingbe kerülő minden kritikus állításnak van visszakövethető forrása.
  • Az uncertainty-jelölések nem vesztek el a production rétegben.
  • A videóból vagy transzkriptből vett idézetek vissza lettek hallgatva vagy ellenőrizve.
  • A scriptből, extractionből vagy browser-lépésből jövő rekordok legalább mintavételesen át lettek nézve.
  • A publikációs döntés előtt a humán reviewer külön végigment a bizonyítékszinten.

Korlátok és failure mode-ok

  • Hallucináció: a modell magabiztosan állít olyat is, amit nem tud bizonyítani.
  • Rossz forrásértelmezés: összefüggést lát ott is, ahol csak közelség vagy véletlen együttállás van.
  • OCR- és transzkripthibák: rossz név, rossz dátum vagy rossz összeg bekerül a struktúrába.
  • Böngésző-automatizálás törékenysége: captcha, layoutváltás, dinamikus tartalom vagy prompt injection.
  • Túl sima szerkesztői draft: a szöveg jónak tűnik, de a mögöttes bizonyítékszint gyenge.
  • Trail hiánya: később nem védhető, hogy egy állítás melyik forrásláncon jutott be a sztoriba.

Ami elsőre kimarad

  • A forrásnapló és a kutatási nyomvonal legalább olyan fontos, mint maga az AI-eszköz.
  • Az emberi ellenőrzés nem a végére odabiggyesztett formalitás, hanem külön munkaréteg.
  • A jó stack nem azonos a 'legerősebb modellel' - sokszor a szervezettség többet számít, mint a nyers modellképesség.
  • A videó- vagy PDF-összefoglaló sosem egyenlő a primer forrással. Idézni csak visszahallgatás és ellenőrzés után szabad.
  • A böngészős vagy scraperes workflow csak akkor hoz értéket, ha a hibakezelés, a naplózás és az exception queue is meg van tervezve.

Döntési keret

Érdemes, ha

  • Sok a repetitív kutatási feladat, és a csapat ideje a bottleneck.
  • Rendszeresen dolgoztok videóval, PDF-fel, registry-anyagokkal vagy nagy URL-halmazokkal.
  • Van legalább alapvető forrásfegyelem és hajlandóság a logolásra.
  • A cél nem varázslat, hanem gyorsabb beérkeztetés, adatkinyerés és ellenőrzés.

Korai vagy rossz fit, ha

  • Nincs standard kutatási folyamat, csak alkalmi improvizáció.
  • Nincs kijelölt ember, aki a review-t és a source quality-t viszi.
  • Érzékeny ügyben teljes automatizmust akartok human gate nélkül.
  • A csapat a modellt elsődleges bizonyítási rétegként szeretné kezelni.
MódMikor elég / mikor kell
Sima chatKevés ügy, kevés input, gyors manuális kutatássegítés
Multimodális modellVideó, PDF és URL egyszerre fontos input
Script + kódfuttatás rétegIsmétlődő adatkinyerési vagy parsing feladat van
Böngészős / tool-use rétegSok kattintásos, API nélküli workflow-t kell bejárni
Trail / governance rétegKésőbb is védeni kell a forrásláncot és a döntési utat

Építs saját workflow-t

  1. 1Válassz ki 1 videós, 1 dokumentumos és 1 webes kutatási feladatot, amit tényleg ismételtek.
  2. 2Írd le külön, hol van intake, triage, extraction, enrichment, verification és production a jelenlegi folyamatban.
  3. 3Jelöld ki, melyik lépésnél segít az AI, és melyik pont marad kizárólag emberi review.
  4. 4Rögzíts fix outputformákat: entity tábla, timeline, fact sheet, briefing.
  5. 5Vezess be uncertainty-jelölést és source logot már a pilotban.
  6. 6Csak akkor mélyíts browser- vagy agentirányba, ha a kisebb pilot már reprodukálható és auditálható.