Testőr egy francia alkalmazás, amely véd a gyűlöletkeltő megjegyzések ellen a YouTube-on és a Twitteren -

A fiatal, 22 éves francia fejlesztő által létrehozott Bodyguard megvédi felhasználóit a gyűlöletkeltő kommentektől a YouTube-on és a Twitteren. Az alkalmazás egyre nagyobb figyelmet kap, és úgy tűnik, hogy megtalálta a közönségét, különösen a YouTuberek körében, akik ma már több mint ezren használják napi rendszerességgel. Mivel a felhasználók 97% -a elégedett és több mint 17 000 megjegyzés blokkolva van, a Testőr hatékony védőbástyának tűnik az interneten való gyűlölet ellen. Ha többet szeretne megtudni a szolgáltatásról és működéséről, feltettünk néhány kérdést a létrehozójának: Charles Cohennek.

Hogyan jött létre az alkalmazás létrehozásának ötlete? ?

A YouTube generációjában születtem, egy olyan webhelyen, ahol 10 éves korom óta (amikor elkezdtem fejleszteni) jártam. A YouTube egy olyan webhely, ahol a számítógépes zaklatás már a kezdetektől fogva jelen van, és egyre inkább pusztítást okoz (csatorna bezárása stb.). Egy nap rábukkantam egy cikkre, amely egy fiatal lány öngyilkosságáról szólt nagyon agresszív számítógépes zaklatás eredményeként, csak néhány kutatást végeztem, hogy megállapítsam, hogy sok hasonló eset volt. Aztán elkezdtem keresni azokat a megoldásokat, amelyek jelen voltak a probléma hatékony leküzdésére: egyik sem. Mindig is szerettem volna kifejleszteni egy startupot, amely ezen a technológián alapul, ez volt a tökéletes alkalom, főleg, hogy valódi igényt kielégített. Ezután vállaltam a tétet és a kockázatot, hogy belekezdjek egy mesterséges intelligencia fejlesztésébe (az AI fogalma nélkül), amiről tudtam, hogy nagyon alacsony hiba/hamis pozitív arányúnak kell lennie, azzal a kockázattal, hogy azonnal elvesztem a felhasználóimat, szó szerint száját, és a testőr "cenzor" kategóriába sorolását.

Mióta dolgozik ezen a projekten ?

Egy éve dolgozom a projekten, és az alkalmazás 6 hónappal ezelőtt indult. Az elején hatalmas problémával szembesültem: nem rendelkeztem adatokkal és adatokkal ahhoz, hogy képezhessem a Testőrt a gyűlöletkeltések észlelésére. Az első 3 hónapban el kellett végeznem néhány címkézési munkát: a Twitter "összecsapások" alapján manuálisan meg kellett mondanom a Testőrnek, hogy mi gyűlöletes és mi nem gyűlölködő. A címkézési munka és az emberi tanulás a mai napig folytatódik, de most van egy adatbázisom, amely 500 000 apróhirdetési megjegyzésből áll.

Technikailag hogyan működik ?

A testőrséget a mesterséges intelligencia irányítja: olyan tevékenységet reprodukál, amelyhez általában emberi agyra van szükség (lásd: mértékletesség.). Elemezzük a mondat kontextusát, és alkalmazkodunk az általunk védett felhasználóhoz. Gyors összefoglalás:

Először a gyűlöletkeltő szavak sorozatára vagy sértésre keresünk (több tízmillió szó kombinációja között), függetlenül a helyesírástól, a hangulatjelektől, az SMS nyelvétől, a LEET nyelvtől, bármi is, ha a felhasználó megpróbálja cenzúrázza a sértést, vagy megkerüli a Testőrt.

Második lépésben elemezzük a kontextust, nevezetesen azt, hogy mi van e szavak előtt és után, és ennek alapján hozunk első döntést: gyűlölködő vagy nem gyűlölködő.

ne hallgass olyan seggfejekre, akik azt mondják, hogy kurva vagy -> a Testőr nem gyűlöletkeltőnek találta.
te p uuuuuuuuuuuuu t e -> gyűlölködő vagy.
Néha komolyan seggfej vagyok -> nem utálatos.
te tényleg groooooossssssssseeeeeeeeeeeeeeeeee ****** -> gyűlölködő.
t anya c tlmnt 1 p * te -> gyűlölködő.

Ezek alapvető példák, de a technológia természetesen mindenfajta erőszakkal működik: fenyegetésekkel, szexuális zaklatásokkal, morálokkal, trollkodásokkal, gúnyolódásokkal, gyűlöletekkel, homofóbiákkal, sértésekkel, rasszizmussal ...

Csúnya -> gúny -> gyűlölködő.
Ne bánja azokat, akik azt mondják, hogy csúnya vagy -> nem utálatos.
T video c szar, nem viccelek -> nincs gyűlölködő.
Nem vagy szép -> gyűlölködő.
Gyönyörű vagy -> nem gyűlölködő.
Ne hallgass azokra, akik azt mondják, hogy szép vagy -> gúnyolódsz -> gyűlölködő vagy.
Nagyon szép vagy, nem, viccelek. -> gúny -> gyűlölködő.
Megérdemli, hogy megerőszakolják. -> szexuális zaklatás -> gyűlölködő.
Anyád megérdemli a pofonokat -> fenyegetést -> gyűlöletet.
A nagyod 👃 -> gúny