Hogyan változtatja meg a természetes nyelv generáció a SEO játékot - a legfrissebb hírek

Úgy tűnik, hogy a technológiai és tartalomgenerálási technikák, amelyeket ebben a rovatban bemutatok, egy tudományos-fantasztikus regényből származnak, de manapság nagyon is valósak és szabadon hozzáférhetők.

Miután befejeztem a kódolási kísérleteket és elkezdtem írni ezt a cikket, elgondolkodtam ezen információk nyilvános megosztásának pozitív és negatív következményein.

Mint látni fogod, manapság viszonylag könnyű a gép által létrehozott tartalom előállítása, és a generációk minősége gyorsan javul.

Ez arra a szomorú következtetésre vezetett, hogy sokkal több spam eredményt fogunk látni, mint korábban.

Szerencsére a Google nemrég közzétette 2019-es spamjelentését, amely nagyon jól érezte magát.

Megnézte már a levélszemét mappáját? Így nézhetnek ki a keresési eredmények a keresési spam leküzdése érdekében tett lépések nélkül. Mai cikkünk azt vizsgálja, hogyan dolgozunk annak megakadályozása érdekében, hogy a spam megjelenjen a Google keresési eredményeiben: https://t.co/RA4lUoDXEF

- Google SearchLiaison (@searchliaison) 2020. június 9

„Tavaly azt tapasztaltuk, hogy a naponta több mint 25 milliárd oldal spam. (Ha ezek az oldalak egy könyv oldalai lennének, az több mint 20 millió "War & Peace" példányt jelentene naponta).

FOLYTATJA AZ OLVASÁST

Erőfeszítéseink biztosítják, hogy az eredményeink látogatásainak több mint 99% -a spammentes tapasztalatokat eredményezzen.

Az elmúlt években megnövekedett az automatikusan létrehozott és karcolt tartalmú spamoldalak száma, olyan viselkedéssel, amely bosszantja vagy károsítja a keresőket, például hamis gombok, invazív hirdetések, gyanús átirányítások és rosszindulatú programok. Ezek az oldalak gyakran megtévesztőek, és valódi értéket nem kínálnak az emberek számára. 2019-ben több mint 60% -kal tudtuk csökkenteni az ilyen típusú spamnek a Keresési felhasználókra gyakorolt ​​hatását 2018-hoz képest.

Míg a Google megdöbbentően sok spamoldalt jelent naponta, lenyűgöző 99% -os sikerarányt jelent a spam elnyomásában általában.

A legfontosabb, hogy hihetetlen lépéseket tettek a gép által létrehozott spamtartalom eltávolításában.

Ebben a témában kóddal elmagyarázom, hogyan képes a számítógép tartalmat létrehozni az NLG legújabb fejlesztéseinek felhasználásával.

Áttekintem az elméletet és néhány irányelvet, hogy tartalma hasznos maradjon.

Ez megakadályozza, hogy elkapja az összes olyan spam, amelyet a Google és a Bing a nap 24 órájában kiküszöböl.

FOLYTATJA AZ OLVASÁST

Vékony tartalmi oldalak

A címek és metaleírások előállításáról szóló cikkemben megosztottam egy hatékony technikát az oldal tartalmának összefoglalására a metacímkék előállításához.

Miután követte a lépéseket, láthatja, hogy nagyon jól működik, sőt néhány kiváló minőségű és kiadatlan szöveget is képes előállítani.

De mi van, ha az oldalak nem tartalmaznak összefoglaló tartalmat? A technika kudarcot vall.

Hadd mondjak el egy nagyon okos trükköt a probléma megoldására.

Ha ezeken az oldalakon minőségi hivatkozások vannak, összefoglaló szövegként használhatja a horgonyszöveget és a linket körülvevő szöveget.

Hadd térjek vissza 1998-hoz, amikor létrehozták a Google keresőmotort.

Az új keresőmotorjukat leíró dokumentumban Page és Brin nagyon érdekes betekintést osztott meg a 2.2 szakaszban.

„A legtöbb keresőmotor egy hivatkozás szöveget társít ahhoz az oldalhoz, amelyen a link található. Ezenkívül társítjuk azt az oldalt is, amelyre a link mutat. Ennek számos előnye van. Első, a horgonyok gyakran pontosabb leírást nyújtanak a weboldalakról, mint maguk az oldalak. Másodszor, horgonyok létezhetnek olyan dokumentumok számára, amelyeket szöveges keresőmotor nem indexelhet, például képek, programok és adatbázisok. Ez lehetővé teszi a ténylegesen be nem térképezett weboldalak visszaküldését ".

Itt van a műszaki terv:

  1. Az új Bing webmestereszközökkel megszerezzük a megfelelő backlinkeket és horgonyszövegeket.
  2. A környező szöveget a legmagasabb minőségű linkekről kaparjuk ki.
  3. Karcolt szöveg felhasználásával összefoglalókat és hosszú tartalmakat készítünk.

Bing Webmestereszközök jelentése

nyelv

A BWT új trackback eszközében az egyik jellemző, hogy nemcsak a saját webhelyére, hanem más webhelyekre is linkeket tud nyújtani.

Arra számítok, hogy ez a fizetős eszközök népszerű és ingyenes alternatívája lesz.

Exportáltam a CSV fájlt a linkek és horgonyok nagy listájával, de amikor megpróbáltam Python pandák segítségével betölteni, számos formázási problémát találtam.

FOLYTATJA AZ OLVASÁST

A véletlenszerű horgonyszövegek vesszőket tartalmazhatnak, és problémákat okozhatnak a vesszővel elválasztott fájlban.

Megoldottam őket azzal, hogy megnyitottam a fájlt Excel-ben, és mentettem Excel-ként.

A környező szöveg karcolása python segítségével

Amint a fenti képernyőképen látható, sok horgonyszöveg meglehetősen rövid.

Megkarcolhatjuk az oldalakat, hogy megkapjuk az azokat tartalmazó bekezdést.

Először töltsük be a BWT-ből exportált jelentést.

Megnéztem a cél URL-t a használt bejövő linkek száma alapján.

Az egyik oldalról felhúztam a linkeket, hogy teszteljem az ötletet ezzel a kóddal.

FOLYTATJA AZ OLVASÁST

Most nézzük meg, hogyan használhatunk cél URL-t és egy visszalinket a horgonyt tartalmazó releváns horgonyszöveg kibontására.

Szövegek lekérése visszalinkekből

Először telepítsük a request-html fájlt.

Annak érdekében, hogy a kód egyszerű legyen, manuálisan előállítok egy CSS-választót a linket körülvevő szöveg beírásához.

Nem nehéz kiszámítani, ha megadjuk a linket és az oldal horgonyát JavaScript vagy Python kód használatával.

Érdemes lehet házi feladatként kipróbálni.