Hogyan változtatja meg a természetes nyelv generáció a SEO játékot - a legfrissebb hírek
Úgy tűnik, hogy a technológiai és tartalomgenerálási technikák, amelyeket ebben a rovatban bemutatok, egy tudományos-fantasztikus regényből származnak, de manapság nagyon is valósak és szabadon hozzáférhetők.
Miután befejeztem a kódolási kísérleteket és elkezdtem írni ezt a cikket, elgondolkodtam ezen információk nyilvános megosztásának pozitív és negatív következményein.
Mint látni fogod, manapság viszonylag könnyű a gép által létrehozott tartalom előállítása, és a generációk minősége gyorsan javul.
Ez arra a szomorú következtetésre vezetett, hogy sokkal több spam eredményt fogunk látni, mint korábban.
Szerencsére a Google nemrég közzétette 2019-es spamjelentését, amely nagyon jól érezte magát.
Megnézte már a levélszemét mappáját? Így nézhetnek ki a keresési eredmények a keresési spam leküzdése érdekében tett lépések nélkül. Mai cikkünk azt vizsgálja, hogyan dolgozunk annak megakadályozása érdekében, hogy a spam megjelenjen a Google keresési eredményeiben: https://t.co/RA4lUoDXEF
- Google SearchLiaison (@searchliaison) 2020. június 9
„Tavaly azt tapasztaltuk, hogy a naponta több mint 25 milliárd oldal spam. (Ha ezek az oldalak egy könyv oldalai lennének, az több mint 20 millió "War & Peace" példányt jelentene naponta).
FOLYTATJA AZ OLVASÁST
Erőfeszítéseink biztosítják, hogy az eredményeink látogatásainak több mint 99% -a spammentes tapasztalatokat eredményezzen.
Az elmúlt években megnövekedett az automatikusan létrehozott és karcolt tartalmú spamoldalak száma, olyan viselkedéssel, amely bosszantja vagy károsítja a keresőket, például hamis gombok, invazív hirdetések, gyanús átirányítások és rosszindulatú programok. Ezek az oldalak gyakran megtévesztőek, és valódi értéket nem kínálnak az emberek számára. 2019-ben több mint 60% -kal tudtuk csökkenteni az ilyen típusú spamnek a Keresési felhasználókra gyakorolt hatását 2018-hoz képest.
Míg a Google megdöbbentően sok spamoldalt jelent naponta, lenyűgöző 99% -os sikerarányt jelent a spam elnyomásában általában.
A legfontosabb, hogy hihetetlen lépéseket tettek a gép által létrehozott spamtartalom eltávolításában.
Ebben a témában kóddal elmagyarázom, hogyan képes a számítógép tartalmat létrehozni az NLG legújabb fejlesztéseinek felhasználásával.
Áttekintem az elméletet és néhány irányelvet, hogy tartalma hasznos maradjon.
Ez megakadályozza, hogy elkapja az összes olyan spam, amelyet a Google és a Bing a nap 24 órájában kiküszöböl.
FOLYTATJA AZ OLVASÁST
Vékony tartalmi oldalak
A címek és metaleírások előállításáról szóló cikkemben megosztottam egy hatékony technikát az oldal tartalmának összefoglalására a metacímkék előállításához.
Miután követte a lépéseket, láthatja, hogy nagyon jól működik, sőt néhány kiváló minőségű és kiadatlan szöveget is képes előállítani.
De mi van, ha az oldalak nem tartalmaznak összefoglaló tartalmat? A technika kudarcot vall.
Hadd mondjak el egy nagyon okos trükköt a probléma megoldására.
Ha ezeken az oldalakon minőségi hivatkozások vannak, összefoglaló szövegként használhatja a horgonyszöveget és a linket körülvevő szöveget.
Hadd térjek vissza 1998-hoz, amikor létrehozták a Google keresőmotort.
Az új keresőmotorjukat leíró dokumentumban Page és Brin nagyon érdekes betekintést osztott meg a 2.2 szakaszban.
„A legtöbb keresőmotor egy hivatkozás szöveget társít ahhoz az oldalhoz, amelyen a link található. Ezenkívül társítjuk azt az oldalt is, amelyre a link mutat. Ennek számos előnye van. Első, a horgonyok gyakran pontosabb leírást nyújtanak a weboldalakról, mint maguk az oldalak. Másodszor, horgonyok létezhetnek olyan dokumentumok számára, amelyeket szöveges keresőmotor nem indexelhet, például képek, programok és adatbázisok. Ez lehetővé teszi a ténylegesen be nem térképezett weboldalak visszaküldését ".
Itt van a műszaki terv:
- Az új Bing webmestereszközökkel megszerezzük a megfelelő backlinkeket és horgonyszövegeket.
- A környező szöveget a legmagasabb minőségű linkekről kaparjuk ki.
- Karcolt szöveg felhasználásával összefoglalókat és hosszú tartalmakat készítünk.
Bing Webmestereszközök jelentése

A BWT új trackback eszközében az egyik jellemző, hogy nemcsak a saját webhelyére, hanem más webhelyekre is linkeket tud nyújtani.
Arra számítok, hogy ez a fizetős eszközök népszerű és ingyenes alternatívája lesz.
Exportáltam a CSV fájlt a linkek és horgonyok nagy listájával, de amikor megpróbáltam Python pandák segítségével betölteni, számos formázási problémát találtam.
FOLYTATJA AZ OLVASÁST
A véletlenszerű horgonyszövegek vesszőket tartalmazhatnak, és problémákat okozhatnak a vesszővel elválasztott fájlban.
Megoldottam őket azzal, hogy megnyitottam a fájlt Excel-ben, és mentettem Excel-ként.
A környező szöveg karcolása python segítségével
Amint a fenti képernyőképen látható, sok horgonyszöveg meglehetősen rövid.
Megkarcolhatjuk az oldalakat, hogy megkapjuk az azokat tartalmazó bekezdést.
Először töltsük be a BWT-ből exportált jelentést.
Megnéztem a cél URL-t a használt bejövő linkek száma alapján.
Az egyik oldalról felhúztam a linkeket, hogy teszteljem az ötletet ezzel a kóddal.
FOLYTATJA AZ OLVASÁST
Most nézzük meg, hogyan használhatunk cél URL-t és egy visszalinket a horgonyt tartalmazó releváns horgonyszöveg kibontására.
Szövegek lekérése visszalinkekből
Először telepítsük a request-html fájlt.
Annak érdekében, hogy a kód egyszerű legyen, manuálisan előállítok egy CSS-választót a linket körülvevő szöveg beírásához.
Nem nehéz kiszámítani, ha megadjuk a linket és az oldal horgonyát JavaScript vagy Python kód használatával.
Érdemes lehet házi feladatként kipróbálni.