Amerikai kutatók létrehoztak egy olyan eljárást, amelyik képes internetes üzenetekből akár valós idejű sporttudósításokat is előállítani. Ehhez az világháló egyik legnépszerűbb szolgáltatásában, a Twitterben megjelenő, legfeljebb 140 karakteres üzeneteket használják fel. A Twitter már eddig is az adatbányászat kedvelt területe volt, mert például szoros összefüggést mutattak ki az üzenetek hangulata és a tőzsdei árfolyamok mozgása között.
A madárcsipogásról elnevezett rendszernek jelenleg 106 millió felhasználója van, akik élő szenzorként másodpercenként átlagosan 640 új üzenetet kürtölnek világgá. Ezekből megfelelő matematikai modellel és számítógépes algoritmussal gyakorlatilag a történésekkel egy időben lehet nagyon megbízható információkhoz jutni.
Ennek alátámasztására a 2010/2011-es szezon amerikai futball mérkőzései alatt keletkezett 19 millió Twitter-üzenetet elemezték és dolgozták fel. A három és fél millió emberi “érzékelő” tudósításaiból kulcsszavak alapján kiszűrték azt a tíz százalékot, ami a mérkőzésekről szólt, és szétválogatták az egyszerre zajló tíz sporteseményre.
