Kuidas kasutada Ngrami vaaturi tööriista Google Booksis

Sisukord:

Kuidas kasutada Ngrami vaaturi tööriista Google Booksis
Kuidas kasutada Ngrami vaaturi tööriista Google Booksis
Anonim

Mida teada

  • Tippige rakenduses Google Books Ngram Viewer fraas, valige kuupäevavahemik ja korpus, määrake silumistase ja klõpsake nuppu Otsi palju raamatuid.
  • Saate andmetesse süveneda. Näiteks kala verbivormi otsimiseks kasutage nimisõna kala asemel märgendit: otsing fish_VERB.
  • Ngram Viewer väljastab graafiku, mis näitab fraasi kasutust läbi aja. Mitme fraasi puhul on iga fraas tähistatud värvikoodiga joonega.

See artikkel selgitab, kuidas kasutada Google Booksi tööriista Ngram Viewer uuringute ja tõhusate otsingute tegemiseks.

Image
Image

Kuidas Ngrami vaatur töötab

Ngramm, mida nimetatakse ka N-grammiks, on teksti- või kõnesisu statistiline analüüs, mille eesmärk on leida tekstist n (arv).

Otsinguüksus võib olla kõikvõimalik, sh foneemid, eesliited, fraasid ja tähed. Kuigi Ngram on väljaspool teadlaskonda ebaselge, kasutatakse seda paljudes valdkondades ja sellel on palju mõju arendajatele, kes kodeerivad arvutiprogramme, mis mõistavad loomulikku kõnekeelt ja reageerivad sellele.

Google Books Ngram Vieweri puhul pärineb analüüsitav tekst suurest hulgast avalikus omandis olevatest raamatutest, mida Google skannib, et täita oma Google Booksi otsingumootorit. Google Books Ngram Vieweri puhul viitab Google otsitavale tekstiosale kui korpusele. Ngram Viewer koondab keele järgi, kuigi saate Briti ja Ameerika inglise keelt eraldi analüüsida või neid kokku liita.

  1. Avage Google Books Ngram Viewer aadressil books.google.com/ngrams.
  2. Sisestage fraas või fraasid, mida soovite analüüsida. Eraldage iga fraas komaga. Google soovitab alustamiseks "Albert Einstein, Sherlock Holmes, Frankenstein".

    NGram Vieweri otsingutes on üksused tõstutundlikud, erinev alt Google'i veebiotsingutest.

  3. Valige kuupäevavahemik. Vaikimisi on 1800 kuni 2000.
  4. Valige korpus. Saate otsida võõrkeelseid tekste või ingliskeelseid tekste ning lisaks tavavalikutele võite loendi lõpus märgata selliseid kirjeid nagu "Inglise keel (2009)" või "Ameerika inglise keel (2009)". Need on vanemad korpused, mida Google on vahepeal värskendanud, kuid teil võib olla põhjust võrrelda vanade andmekogumitega. Enamik kasutajaid võib neid ignoreerida ja keskenduda kõige värskematele korpustele.
  5. Määrake silumisaste. Silumine viitab sellele, kui sujuv on graafik lõpus. Kõige täpsem esitus peegeldab tasandustaset 0, kuid seda sätet võib olla raske lugeda. Vaikimisi on seatud 3. Enamikul juhtudel ei pea te seda kohandama.
  6. Vajutage Otsige palju raamatuid.

Kasutades Google'i Ngram Viewerit, saate andmetesse süveneda. Kui soovite nimisõna kala asemel otsida tegusõna kala, saate seda teha siltide abil. Sel juhul tuleks otsida kala_VERB.

Google pakub oma veebisaidil täielikku käskude loendit ja muud täpsemat dokumentatsiooni, mida Ngram Vieweriga kasutada.

Alumine rida

Google Books Ngram Viewer väljastab graafiku, mis kajastab teatud fraasi kasutamist raamatutes läbi aja. Kui sisestasite rohkem kui ühe sõna või fraasi, tähistatakse igaüks neist värvikoodiga joonega, mis on kontrastiks teiste otsinguterminitega. See sarnaneb Google Trendsiga, ainult otsing hõlmab pikemat perioodi.

Juhtumiuuring

Mõelge äädikapirukate juhtumiuuringule. Neid mainitakse Laura Ingalls Wilderi sarjas Little House on the Prairie. Äädikapirukate kohta lisateabe saamiseks Google'i veebiotsingu abil selgub, et neid peetakse Ameerika lõunamaa köögi osaks ja need on tõepoolest valmistatud äädika abil. Nad kuulavad tagasi aega, mil kõigil ei olnud igal aastaajal juurdepääsu värsketele toodetele, kuid kas see on kogu lugu?

Otsige Google'i Ngram Viewerist äädikapirukat ja kohtate nii 1800. aastate alguses kui ka lõpus, palju mainimisi 1940. aastatel ja viimasel ajal üha rohkem mainimisi. Kui aga tasandusaste on 3, näete 1800. aastate mainimiste kohal platood. Kuna selle aja jooksul ei ilmunud palju raamatuid ja kuna andmed on seatud sujuvaks, on pilt moonutatud. Tõenäoliselt mainiti äädikapirukat ainult ühes raamatus ja piigi vältimiseks võeti see keskmine. Seades silumiseks 0, näete, et see on täpselt nii. Tipp keskendub 1869. aastale ja veel üks tipp on aastatel 1897 ja 1900.

On ebatõenäoline, et keegi ülejäänud aja äädikapirukatest ei rääkinud: tõenäoliselt vedelesid kõikjal retseptid, kuid inimesed ei kirjutanud neist raamatutesse ja see on Ngrami otsingute oluline piirang.

Soovitan: