Shine it all around!

This blog contains some information, links, thoughts etc needed for my PhD research (the language of Internet communicaton)

Books and Music That Make You Dumb 5 märts, 2009

Filed under: korpus,sotsiaalsed võrgustikud — Anni @ 2:14 p.l.

http://blogs.wsj.com/digits/2009/02/27/books-and-music-that-make-you-dumb/

By Marisa Taylor

Anyone who has ever sought to justify their own musical or literary taste may find some solace in the side project of Virgil Griffith, a 25-year-old Caltech graduate student known for embarrassing numerous corporations with his WikiScanner, the database that tracks the sources of anonymous edits to Wikipedia entries.

With his two Web sites (which have crashed from too much traffic), Booksthatmakeyoudumb.virgil.gr and Musicthatmakesyoudumb.virgil.gr, Griffith used aggregated Facebook data about the favorite bands and books among students of various colleges and plotted them against the average SAT scores at those schools, creating a tongue-in-cheek statistical look at taste and intelligence.

musictastes_E_20090227111659.jpg

For example, the favorite musician of the smartest students was Beethoven, with an average SAT score of 1371. Also on the “smart” end of the scale were Sufjan Stevens (1260), Counting Crows (1247), and Radiohead (1220). And sadly for Lil Wayne, enjoying his music was associated with being the dumbest, with an average SAT score of 889.

On the book front, Lolita was favorite tome of the brightest students (a result which Griffith called “charming”), with an average SAT score of 1317. The lowest-scoring students liked the erotica author Zane, with an average score of 980. And strangely, the students who listed their favorite book as “The Bible” were smarter (1047) than those who said it was “The Holy Bible” (980).

Ironically, students who wrote “I don’t read” in the space for favorite books were only slots 14 from the bottom in terms of SAT scores, meaning that there were 13 other favorite books that theoretically made students “dumber” than not reading books at all.

Griffith came up with the idea as a way to show how to take two separate sets of data that were pretty straightforward on their own — in this case, the average SAT score and the favorite books among students at various universities — and combine them to become more interesting. Griffith says, “Their unity is hilarity incarnate. This is to inspire people to think creatively about the data sets that are on the Internet.”

“Of course there is the whole correlation is not causation thing, but, I mean, duh,” he added.

He did find that he had to adjust his measurements and weigh schools according to how populous they were, because small liberal arts colleges were dominating the rankings. For example, Caltech, where he is currently pursuing a doctoral degree, had the highest average SAT score, at 1520, and the school’s favorite band was Radiohead — but with only 913 undergrads, it doesn’t weigh as heavily, as, say, Texas A&M, with more than 35,000 students.

As for his own place on the scale, Griffith’s favorite band is Daft Punk, which didn’t make it onto the list, and his SAT score was “actually fairly low — 1370 out of 1600. I’m actually a little embarrassed by it,” he wrote in an email message, though he then noted, “My GRE was a very acceptable 1490 out of 1600.” The bands that are on the list that he likes? “I actually like Tool a lot, and I see Tool is one of the dumber ones on there. That’s pretty charming.”

Griffith is used to creating controversy, or at least being accused of trying to stir it up — as the founder of WikiScanner, a database that tracks the IP addresses of anonymous Wikipedia editors, he revealed that the CIA, the Vatican, and staff of various members of Congress (among others) had made edits on the site to remove potentially sensitive information.

 

Instant messaging ‘a linguistic renaissance’ for teens 17 mai, 2008

Filed under: netikeel — Anni @ 2:37 p.l.
  • 15 May 2008
  • NewScientist.com news service
  • Mark Peters

http://technology.newscientist.com/channel/tech/mg19826566.600-instant-messaging-a-linguistic-renaissance-for-teens.html?feedId=online-news_rss20

Related Articles
<!–
var myDate = new Date();
AT_MISC = myDate.getTime();
document.write(‘<scr’ + ‘ipt src=”http://adserver.adtech.de/?addyn|2.0|289|113580|1|170|ADTECH;key=vt-tech-news+art-mg19826566.600;target=nsad;loc=100;misc=’ + AT_MISC + ‘;grp=123038967;”>’);
if (navigator.userAgent.indexOf(“Mozilla/2.”) >= 0 || navigator.userAgent.indexOf(“MSIE”) >= 0) {
document.write(‘<a href=”http://adserver.adtech.de/?adlink|2.0|289|113580|1|170|ADTECH;key=vt-tech-news+art-mg19826566.600;grp=123038967;loc=200;” target=”nsad”><img src=”http://adserver.adtech.de/?adserv|2.0|289|113580|1|170|ADTECH;key=vt-tech-news+art-mg19826566.600;grp=123038967;loc=200;” border=”0″ width=”300″ height=”250″></a>’);
}
document.write(‘</scr’ + ‘ipt>’);// –>
<div><a href=”http://adserver.adtech.de/?adlink|2.0|289|113580|1|170|ADTECH;key=vt-tech-news+art-mg19826566.600;grp=123038967;loc=300;” target=”nsad”><img src=”http://adserver.adtech.de/?adserv|2.0|289|113580|1|170|ADTECH;key=vt-tech-news+art-mg19826566.600;grp=123038967;loc=300;” width=”300″ height=”250″ alt=”Advertising”/></a></div>

LOL, OMG and TTYL: parents and teachers worry that teenagers’ use of these and other forms of online shorthand is harming their language skills. Perhaps they will take comfort from a study suggesting that instant messaging (IM) actually represents “an expansive new linguistic renaissance”.

“Instant messaging represents an expansive new linguistic renaissance”

Sali Tagliamonte and Derek Denis at the University of Toronto, Canada, say teenagers risk the disapproval of their elders if they use slang, and the scorn of their friends if they sound too buttoned-up. But instant messaging allows them to deploy a “robust mix” of colloquial and formal language. In a paper to be published in the spring 2008 issue of American Speech, the researchers argue that far from ruining teenagers’ ability to communicate, IM lets teenagers show off what they can do with language.

“IM is interactive discourse among friends that is conducive to informal language,” says Denis, “but at the same time, it is a written interface which tends to be more formal than speech.”

He and Tagliamonte analysed more than a million words of IM communications and a quarter of a million spoken words produced by 72 people aged between 15 and 20. They found that although IM shared some of the patterns used in speech, its vocabulary and grammar tended to be relatively conservative. For example, teenagers are more likely to use the phrase “He was like, ‘What’s up?’” than “He said, ‘What’s up?’” when speaking – but the opposite is true when they are instant-messaging. This supports the idea that IM represents a hybrid form of communication.

Nor do teens use abbreviations as much as the stereotype suggests: LOL (laugh out loud), OMG (oh my god), and TTYL (talk to you later) made up just 2.4 per cent of the vocabulary of IM conversations – an “infinitesimally small” proportion, say the researchers. And rumours of the demise of you would appear to have been greatly exaggerated: it was preferred to u a whopping 9 times out of 10. Tagliamonte and Denis suggest that the use of such short forms is confined mostly to the youngest users of IM.

From issue 2656 of New Scientist magazine, 15 May 2008, page 28
 

allikad 4 märts, 2008

Filed under: sisevaade — Anni @ 9:43 e.l.

Võtsin täna käsile allikmaterjalide korrastamise. Arvutisse kirjutatud tükid jagasin failidesse – igasse faili ühe raamatu/artikli tsitaadid koos ilmumisandmetega, raamatud ja artiklid eraldi kasutadesse. Ühtlasi tegin tabelifaili, kuhu panen kirja autori, pealkirja, allika liigi ja selle, mis kujul ja kui palju mul olemas on (nt paljundus, tsitaadid failis). Vahepeal hakkas materjali nii palju saama, et ülevaade kadus, nüüd on hea kohe teemade kaupa vaadata.

 

EPL: suhtlusportaalidest 20 veebruar, 2008

Filed under: õiguslik — Anni @ 4:33 p.l.

Andmekaitseseadus määrab, et kui inimene on oma andmed suhtlusportaali kaudu avalikuks muutnud, puudub ka võimalus piirata nende avalikustamist teistes avalikes kanalites.”

http://www.epl.ee/artikkel/418897

 

Uurimuse mõistete valimine ja defineerimine 17 veebruar, 2008

Filed under: kirjutamine — Anni @ 9:51 p.l.

Raamatust “Uuri ja kirjuta” (Sirkka Hirsjärvi, Pirkko Remes, Paula Sajavaara 2005, lk 148)

  • Defineeri oma uurimuse olulisemad mõisted.
  • Selgita kõigepealt, missugusest vaatenurgast või teoreetilisest suunast lähtudes käsitled uuritavaid nähtusi.
  •  Selgita, mis on uurimuse põhimõisted ehk teoreetilised mõisted. Pea meeles, et ühes uurimuses ei ole neid tavaliselt palju.
  • Kaalu, missuguseid muid vajalikke mõisteid on vaja seletada. Need võivad olla seotud näiteks praktika seikadega.
  • Kaalu hoolsasti, kas on tegelikult põhjendatud välja mõelda täiesti uusi mõisteid.
  • Väldi jäika ja mehaanilist mõistete laenamist teistest uurimustest ilma omapoolse kaalumiseta.
  • Püüa mõista põhimõisteid süvitsi ja mitmekülgselt.
  • Kui oled esitanud samast terminist mitu definitsiooni, jõua oma käsitlusega mingi valikuni. Põhjenda oma valik.
  • Pea meeles, et operatsionaliseerimine on alati tõlgendamine.
  • Arvesta, et operatsionaliseerimine ei too esile termini tähendust.
  • Ära pealkirjasta oma uurimisaruandes mõnda osa sõnadega “Uurimuse mõistete määratlemine” (või mingi muu formaalse fraasiga), vaid sõnasta sisu väljendav pealkiri.
 

Sõnastik 8 veebruar, 2008

Filed under: korpus — Anni @ 4:46 p.l.

Idee:

- sotsiolingvistilist infot sisaldav sõnastik

- genereeritakse automaatselt korpuse põhjal

- esialgu sõnavormide põhine, pärast vaatab, kas tasub algvormidele taandada või mitte

- sisaldab: sõnavorm, kasutusnäited korpusest, sotsiolgv kasutusinfo: mehed-naised, vanus, levik, kasutajate keeleoskus, võib-olla mingi kombineeritud graafik: ajajoon pluss vanus pluss sugu pluss veel midagi

- kui lemmatiseerijale lisareegleid kirjutada, võib üritada ka analüüsi

- sõnavormid ka käsitsi üle vaadata, sagedusjärjestus ja sealt ülevalt alla

- mida teha variatsioonidega a la nummi-nummmi?

- kord kuus (vm intervalliga) uuendatakse korpuse põhjal. Korpust omakorda uuendatakse kord kuus – kui korpuseuuendus lõpeb, algab sõnastiku-uuendus. Seda intervalli peab natuke jälgima ja mingi mõistliku variandi välja töötama

- lõbu laialt nii endal kui teistel keeleuurijatel :)

- ja kui seda mingil põhjusel ei õnnestu lõpuni realiseerida, on ka need põhjused oluline tulemus

- morf. tasandi & ortograafia saab samuti jooksvalt sealt kätte

- ja kui see kõik töötab ja veel midagi teha tahaks, saab alati neile sõnadele kõiksugu automaatanalüüse tegema hakata

 

A Myspace Love Story 5 veebruar, 2008

Filed under: inimesed — Anni @ 1:03 p.l.
 

Veeb 28 jaanuar, 2008

Filed under: sisevaade — Anni @ 3:22 e.l.

Vaatasin Ateena ülikooli teadurite peeneid kodulehti ja piinlik hakkas, kuidas ma neile küll kirjutan, kui endal pole veebi ollagi?

Ühtlasi jõudsin kiiresti järeldusele, et ingliskeelne koduleht annab kõvasti uusi suhtlusvõimalusi. Need, kes oma teadushuvisid ainult kreeka keeles kirjeldasid või kellel üldse kodulehte polnud, jäid kahjuks mu kontaktiotsingutest välja. Kreeka tähed kannatab ju kokku lugeda, aga sisu juures läks keeruliseks.

Niisiis klopsisin mingi veebi kokku. Alustuseks käib seegi, vähemalt saab sealt välja lugeda, et uurin internetisuhtlust ja et mulle saab meili saata :)

 

Doktorantuur? 27 jaanuar, 2008

Filed under: õiguslik — Anni @ 8:55 p.l.

Kõrgharidustaseme astmete õpitulemused

(Vabariigi Valitsuse 13. augusti 2002. a määruse nr 258 “Kõrgharidusstandard” lisa (Kehtestatud Vabariigi Valitsuse 16. augusti 2007. a määrusega nr 207)

..

4. Doktorikraadi saamiseks peab üliõpilane:

- omama laiapõhjalisi teadmisi ja süsteemset ülevaadet oma uurimisvaldkonnas ning sügavaid ja ajakohaseid teadmisi uurimisvaldkonna kitsamas osas;

- mõistma olemasolevate uurimisvaldkonna siseste ja valdkondadevaheliste teadmiste ja uurimismeetodite tähendust ja ulatust, et neid vajadusel laiendada, ümber hinnata ja sõnastada;

- oskama iseseisvalt ja kriitiliselt analüüsida, sünteesida ja hinnata uusi ja keerulisi erialaspetsiifilisi ideid ning loovalt ja teadusliku täpsusega identifitseerida ja formuleerida uurimisküsimusi;

- valdama oma uurimisvaldkonna uurimismetoodikaid;

- oskama iseseisvalt tegutseda keerulises, sealhulgas rahvusvahelises töö- ja õpikeskkonnas, sealhulgas uurimistöös, mis nõuab juhtimis- ja meeskonnatööoskusi, innovaatilist mõtlemist ning strateegiliste otsuste tegemise võimet;

- oskama algatada, kavandada, rakendada ja kriitiliselt hinnata uurimis- ning arendustöid, mis viivad uute teadmiste ning protseduuriliste lahendusteni;

- oskama anda teoreetilisi hinnanguid, saama aru teaduse võimalustest ja piirangutest, teaduse ühiskondlikust rollist ning inimeste vastutusest teadussaavutuste kasutamisel;

- suutma analüüsida sotsiaalseid norme ja suhteid, neile vastata ning tegutseda vajadusel nende muutmiseks;

- olema võimeline suuliselt ja kirjalikult esitama teadussuuna ja oma uurimistööga seonduvaid probleeme, järeldusi ja nende aluseks olevaid teooriaid nii erialaspetsialistidest auditooriumile kui ka erialaväliste inimestega suhtlemisel, argumenteerima ning osalema sellekohastes aruteludes oma õppekeeles ja oma erialal olulises võõrkeeles, sealhulgas avaldama originaalseid teadustulemusi rahvusvaheliselt eelretsenseeritavates teadusväljaannetes või kunstide erialadel loometöid rahvusvahelisele auditooriumile;

- oskama identifitseerida oma vajadusi uute teadmiste või oskuste järele ning toetama teiste õppimist nii hariduse ja teaduse kontekstis kui ka laiemal ühiskondlikul tasandil;

- olema pädevalt võimeline edasi andma oma teadmisi õpetamise, juhendamise või muul teel.

—————————————————————————

Euroopa kvalifikatsiooniraamistiku tasemete kirjeldused

8. tase (doktoriõpe)

8. taseme õpitulemused

Teadmised: teadmised, mis on töö- või õppesuunaalaste ja valdkondadevaheliste teadmiste esirinnas

Oskused: eriti arenenud ja spetsialiseeritud oskused ja tehnikad, kaasa arvatud süntees ja hindamine, mis on vajalikud kriitiliste küsimuste lahendamiseks teadus- ja/või innovatsioonitegevuses ja olemasolevate teadmiste või kutseoskuste täiendamiseks ning uuesti määratlemiseks

Pädevus: omab autotiteeti ja demonstreerib oma novaatorlikkust, iseseisvust, teadus- ja kutsealast meisterlikkust ning pidevat pühendumust uute ideede või protsesside arendamisel töö- või õppesituatsioonide, sh teadustöö, esirinnas

 

Tehnilist 7 jaanuar, 2008

Filed under: korpus — Anni @ 2:55 p.l.

Faile saab tagurpidi keerata käsuga tac (cat tagurpidi :)

Idee keelte automaatseks märgendamiseks: märgendada keeleinfoga hoopis unikaalsete sõnede loend ja lasta keeleinfot märgendada nende alusel. Kui lause sisaldab mitme erineva keele sõnu, siis a) lisada kõik keeled, b) rakendada lisatingimusi: vaadata kirjutaja ja adressaadi keeleoskusi, c) jätta märgendamata või kasutada eraldi märgendit.

Üksildaste sõnavormide välistamiseks peaks sõnavarauuringus tabelisse esialgu võtma need stringid, mida vähemalt 2x leitakse, võib-olla isegi 3x.. seda peab katsetama, kumb parema tulemuse annab.

Pidevalt oleks vaja sellist korpust: sisaldab kommentaaride kõrval ka paari kasutajainfo välja (vanus, sugu, vb keeleoskus), tekstid on ajalises järjestuses.

Kui korpuse jaoks korraliku MySQLiga serveri saab, peaks koos arendustööga kohe dokumenteerima hakkama. Oluline!

 

 
Follow

Get every new post delivered to your Inbox.