Cum să accesați cu crawlere un site mare și să extrageți datele folosind Screaming Frog's SEO Spider

Screaming Frog SEO Spider
Timp de citit: 3 minute

Asistăm mai mulți clienți chiar acum Migrațiile Marketo. Deoarece companiile mari utilizează astfel de soluții de întreprindere, este ca o pânză de păianjen care se împletește în procese și platforme de-a lungul anilor ... până în momentul în care companiile nici măcar nu sunt conștiente de fiecare punct de contact.

Cu o platformă de automatizare a marketingului pentru întreprinderi precum Marketo, formularele reprezintă punctul de intrare al datelor pe site-uri și pagini de destinație. Companiile au adesea mii de pagini și sute de formulare pe site-urile lor care trebuie identificate pentru actualizare.

Un instrument excelent pentru acest lucru este Screaming Frog's SEO Spider… Poate cea mai populară platformă de pe piață pentru accesarea cu crawlere, auditarea și extragerea datelor de pe un site. Platforma este bogată în funcții și oferă sute de opțiuni pentru practic fiecare sarcină de care aveți nevoie.

Screaming Frog SEO Spider: Crawl and Extract

O caracteristică cheie a Screaming Frog SEO Spider este că puteți efectua extracții personalizate pe baza regex, XPath, Sau CSSPath specific. Acest lucru este extrem de util deoarece vrem să accesăm cu crawlere site-urile clientului și să audităm și să captăm valorile MunchkinID și FormId din pagini.

Cu instrumentul, deschideți Configurare> Personalizat> Extragere pentru a identifica elementele pe care doriți să le extrageți.

extragere personalizată screamingfrog

Ecranul de extracție permite colectarea de date practic nelimitată:

Screaming Frog SEO Spider Spider Extraction Rules

Regex, XPath și CSSPath Extraction

Pentru MunchkinID, identificatorul se află în scriptul de formular din pagină:

<script type='text/javascript' id='marketo-fat-js-extra'>
    /* <![CDATA[ */
    var marketoFat = {
        "id": "123-ABC-456",
        "prepopulate": "",
        "ajaxurl": "https:\/\/yoursite.com\/wp-admin\/admin-ajax.php",
        "popout": {
            "enabled": false
        }
    };
    /* ]]> */

Aplicăm apoi un Regula Regex pentru a captura ID-ul din eticheta de script inserată în pagină:

Regex: ["']id["']: *["'](.*?)["']

Pentru ID-ul formularului, datele se află într-o etichetă de intrare în formularul Marketo:

<input type="hidden" name="formid" class="mktoField mktoFieldDescriptor" value="1234">

Aplicăm un Regula XPath pentru a captura ID-ul din formularul inserat în pagină. Interogarea XPath caută un formular cu o intrare cu un nume de formid, apoi extracția salvează valoare:

XPath: //form/input[@name="formid"]/@value

Screaming Frog SEO Spider Javascript Rendering

O altă opțiune excelentă a Screaming Frog este că nu vă limitați la codul HTML din pagină, puteți reda orice JavaScript care va insera formulare pe site-ul dvs. În Configurare> Spider, puteți merge la fila Rendering și activați acest lucru.

Screaming Frog SEO Spider Javascript Rendering

Acest lucru durează puțin mai mult pentru accesarea cu crawlere a site-ului, desigur, dar veți primi formulare care sunt redate din partea clientului de către JavaScript, precum și formulare care sunt inserate din partea serverului.

Deși aceasta este o aplicație foarte specifică, este una extrem de utilă, deoarece lucrați cu site-uri mari. Veți dori absolut să auditați unde sunt încorporate formularele dvs. pe tot site-ul.

Descărcați Screaming Frog SEO Spider

Ce părere ai?

Acest site folosește Akismet pentru a reduce spamul. Aflați cum sunt procesate datele despre comentarii.