Kā lietot Ngram skatītāja rīku pakalpojumā Google grāmatas

Satura rādītājs:

Kā lietot Ngram skatītāja rīku pakalpojumā Google grāmatas
Kā lietot Ngram skatītāja rīku pakalpojumā Google grāmatas
Anonim

Kas jāzina

  • Google grāmatu Ngram skatītājā ierakstiet frāzi, izvēlieties datumu diapazonu un korpusu, iestatiet izlīdzināšanas līmeni un noklikšķiniet uz Meklēt daudz grāmatu.
  • Varat izpētīt datus. Piemēram, lai meklētu darbības vārda formu zivs, nevis lietvārdu zivs, izmantojiet tagu: search for fish_VERB.
  • Ngram Viewer izvada grafiku, kas atspoguļo frāzes lietojumu laika gaitā. Vairākām frāzēm katra ir apzīmēta ar krāsu kodētu līniju.

Šajā rakstā ir paskaidrots, kā pakalpojumā Google grāmatas izmantot rīku Ngram Viewer, lai veiktu izpēti un veiktu meklēšanu.

Image
Image

Kā darbojas Ngram Viewer

Ngramma, saukta arī par N-grammu, ir teksta vai runas satura statistiskā analīze, lai tekstā atrastu n (skaitli) kāda veida vienumam.

Meklēšanas vienums var būt visdažādākais, tostarp fonēmas, prefiksi, frāzes un burti. Lai gan ārpus pētnieku kopienas Ngram ir neskaidra, tā tiek izmantota dažādās jomās, un tai ir liela nozīme izstrādātājiem, kuri kodē datorprogrammas, kas saprot un reaģē uz dabisko runāto valodu.

Google grāmatu Ngram Viewer gadījumā analizējamais teksts nāk no liela skaita publiskajā domēnā esošo grāmatu, ko Google skenēja, lai aizpildītu savu Google grāmatu meklētājprogrammu. Google grāmatu Ngram skatītājam Google atsaucas uz teksta pamattekstu, kuru vēlaties meklēt, kā korpusu. Ngram Viewer apkopo pēc valodas, lai gan jūs varat atsevišķi analizēt britu un amerikāņu angļu valodu vai apvienot tos kopā.

  1. Dodieties uz Google grāmatu Ngram skatītāju vietnē books.google.com/ngrams.
  2. Ierakstiet jebkuru frāzi vai frāzes, ko vēlaties analizēt. Atdaliet katru frāzi ar komatu. Lai sāktu darbu, Google iesaka: "Alberts Einšteins, Šerloks Holmss, Frankenšteins".

    Atšķirībā no Google tīmekļa meklēšanas, NGram Viewer meklējumos vienumi ir reģistrjutīgi.

  3. Atlasiet datumu diapazonu. Noklusējums ir no 1800 līdz 2000.
  4. Izvēlieties korpusu. Varat meklēt tekstus svešvalodās vai tekstus angļu valodā, un papildus standarta izvēlēm saraksta apakšā varat pamanīt tādus ierakstus kā "angļu valoda (2009)" vai "amerikāņu angļu valoda (2009)". Šie ir vecāki korpusi, kurus Google kopš tā laika ir atjauninājis, taču jums var būt iemesls salīdzināt ar vecām datu kopām. Lielākā daļa lietotāju var tos ignorēt un koncentrēties uz jaunākajiem korpusiem.
  5. Iestatiet izlīdzināšanas līmeni. Izlīdzināšana attiecas uz to, cik gluda ir diagramma beigās. Visprecīzākais attēlojums atspoguļo izlīdzināšanas līmeni 0, taču šo iestatījumu var būt grūti nolasīt. Noklusējums ir iestatīts uz 3. Vairumā gadījumu jums tas nav jāpielāgo.

  6. Nospiediet Meklēt daudz grāmatu.

Izmantojot Google Ngram Viewer, varat izpētīt datus. Ja lietvārda zivs vietā vēlaties meklēt darbības vārdu zivs, varat to izdarīt, izmantojot atzīmes. Šajā gadījumā jūs meklētu fish_VERB.

Google savā vietnē nodrošina pilnu komandu sarakstu, cita papildu dokumentācija lietošanai ar Ngram Viewer.

Bottom Line

Google grāmatu Ngram skatītājs izvada grafiku, kas atspoguļo konkrētas frāzes lietojumu grāmatās laika gaitā. Ja ievadījāt vairāk nekā vienu vārdu vai frāzi, katrs no tiem tiek attēlots ar krāsu kodētu līniju, lai kontrastētu ar citiem meklēšanas vienumiem. Tas ir līdzīgs Google Trends, tikai meklēšana aptver ilgāku periodu.

Gadījuma izpēte

Apsveriet gadījuma izpēti par etiķa pīrāgiem. Tie ir pieminēti Lauras Ingalsas Vailderes seriālā Little House on the Prairie. Izpētot, izmantojot Google tīmekļa meklēšanu, lai uzzinātu vairāk par etiķa pīrāgiem, atklājas, ka tie tiek uzskatīti par daļu no Amerikas dienvidu virtuves un patiešām tiek gatavoti ar etiķi. Viņi atgriežas pie laikiem, kad ne visiem bija pieejami svaigi produkti jebkurā gadalaikā, bet vai tas ir viss stāsts?

Meklējiet pakalpojumā Google Ngram Viewer etiķa pīrāgu, un jūs redzēsit dažus pīrāga pieminējumus gan 1800. gadu sākumā, gan beigās, daudzus pieminējumus 20. gs. 40. gados un arvien vairāk pieminējumu pēdējā laikā. Tomēr, ja izlīdzināšanas līmenis ir 3, 1800. gados ir redzams plato virs pieminēšanas. Tā kā tajā laikā grāmatu nebija daudz izdots un dati ir iestatīti vienmērīgi, attēls ir izkropļots. Droši vien tikai vienā grāmatā bija minēts etiķa pīrāgs, un tas tika aprēķināts vidēji, lai izvairītos no smaile. Iestatot izlīdzināšanu uz 0, jūs varat redzēt, ka tas tā ir. Smailes centrā ir 1869. gads, un vēl viens pieaugums ir 1897. gadā un 1900. gadā.

Maz ticams, ka pārējā laikā neviens nerunāja par etiķa pīrāgiem: iespējams, receptes peldēja visur, taču cilvēki par tām nerakstīja grāmatās, un tas ir būtisks Ngram meklēšanas ierobežojums.

Ieteicams: