Nyelvi jellemzőik alapján is azonosíthatók az álhírek

1 day ago

„Nincs olyan definíció, ami minden egyes álhírre alkalmazható lenne” – válaszolta Németh T. Enikő nyelvész arra a kérdésemre, hogy mit tekintenek álhírnek. A legtöbb meghatározás a hamisságot és a megtévesztési szándékot emeli ki, de a magyar terminológia nem különbözteti meg egymástól a szándékos és a nem szándékos megtévesztést, szemben az angollal, ahol létezik a disinformation és a misinformation kifejezés. Németh T. szerint az előbbi nevezhető igazából álhírnek, de fontos elem, hogy a dezinformálás haszonszerzés céljából történjen, ami persze lehet az anyagi mellett politikai vagy társadalmi „haszon” is.

Németh T. szerint az álhírmeghatározást az is nehezíti, hogy a modern tudományelméletben az igaz-hamis felosztás nem annyira használatos, mivel van közöttük egy szürkezóna, és változik is az információk megítélése: „Lehet, hogy húsz év múlva valami igaz lesz, amiről korábban azt gondolták, hogy nem az”. Ezért csapatuk az igaz-hamis elkülönítés helyett inkább a források megbízhatóságára koncentrál.

A nyelvészet és az informatika szorosan tud kapcsolódni

Németh-Tóth Enikő nyelvész, a Szegedi Tudományegyetem Általános Nyelvészeti Tanszékének vezetője, Csendes Tibor pedig a Szegedi Tudományegyetem Számítógépes Optimalizálás Tanszék tanára. Kutatócsoportjukkal arra tesznek kísérletet, hogy kidolgozzák az egészségügyi álhírek nyelvészeti azonosítását, és mindehhez eszközöket is készítsenek.

Szélesebb körben a ChatGPT és a hasonló nagy nyelvi modellek megjelenése tette ismertté, hogy a nyelvészet és az informatika milyen szorosan tud kapcsolódni. Németh T. és Csendes szerint azonban ez egyáltalán nem újkeletű. Németh T. elmondta, hogy amikor az 1960-as években filozófusok elkezdtek gondolkodni a mesterséges intelligencián, a nyelvészek nagyon hamar kapcsolódtak. „Számítógépes nyelvészet, mesterségesintelligencia-kutató nyelvészet és formális nyelvészet régóta dolgozik együtt az informatikával” – mondta.

Az MTA Tudomány a Magyar Nyelvért Nemzeti Program Álhírek, áltudományos nézetek nyelvészeti alapú azonosítása című alprogramjának négy éve alatt a kutatók három területen dolgoznak:

az álhírek és áltudományos szövegek vizsgálatának tudományelméleti megalapozásán,
egészségügyi álhírek és áltudományos szövegek nyelvi jellemzőinek és nyelvhasználati stratégiáinak feltárásán
és automatikus álhírazonosító programok fejlesztésén.

Az ötlet, hogy álhírazonosítással foglalkozzanak, a Covid-járvány alatt jutott eszükbe, mert látták, hogy nagyon sok álhír és rossz tanács terjed az interneten, elég, ha csak a Donald Trump által javasolt fertőtlenítős oltakozásra gondolunk. „Azt akartuk, hogy az emberek felismerjék, ha álhírt olvasnak. Megfogalmazódott, hogy a nyelvi jegyek alapján szeretnénk őket azonosítani, ehhez pedig közvetlenül tudtak kapcsolódni az informatikus kollégák” – mesélte Németh T., aki szerint ha a nyelvészek meg tudják fogalmazni az álhíreket jellemző nyelvi tulajdonságokat, akkor az informatikusok be tudják építeni ezeket a programjaikba.

A tanszékvezető szerint alapvetően háromféle módon történik az álhírek azonosítása: tényellenőrzéssel, nyelvészeti alapon (főként a szókészletet vizsgálva) és mesterséges intelligenciával.

Kutatócsoportjuk újdonsága, hogy amikor az álhíreket vizsgálják, nem kifejezetten a szavakkal, hanem inkább a grammatikával és a pragmatikával, azaz a nyelvtannal és a nyelvhasználat vizsgálatával foglalkoznak.

„A csoportban sokan foglalkoztunk korábban is a nyelvhasználat vizsgálatával, tehát sokat tudunk arról, mi az, hogy megtévesztés, manipuláció és befolyásolás, márpedig az álhírek hemzsegnek ezek eszközeitől” – mondta.

Csendes Tibor szerint nagy különbség a módszerek között, hogy amíg a tényellenőrzés hosszadalmas, és emberi munkát igényel, addig az általuk elképzelt és részben meg is valósított megoldás gyors közelítő eredményt ad. Ezen kívül visszakereshető, hogy mely nyelvi jegyek miatt döntött úgy a program, hogy egy szöveget gyanúsnak címkéz. A programok hátránya az, hogy a szabályok megfogalmazása nagyon sok időt és sok nyelvészi munkát igényel. „Ezen kívül van a mesterséges intelligencia. Ez rémisztő világ, mert könnyű megvalósítani az eszközt, és meglepően pontos eredményt ad, viszont nem visszakereshető a döntések háttere” – magyarázta Csendes.

The post Nyelvi jellemzőik alapján is azonosíthatók az álhírek first appeared on 24.hu.