Mikel Iturbek #hitzokei jokorako gordailua prestatzen zebilela esan eta segituan etorri zitzaidan burura bazegoela hori guztia automatizatzeko modua. Hau da, #hitzokei etiketadun Twitterreko mezuak hartu eta datu-base batean gordetzea hiztegi-sarrerak bailiran.
Esan eta egin. Aje egunak ez dira aproposenak halako gauzak burutik bueltaka ibiltzeko baina bai ordea ekimena izateko. Oraindik egitekoak badauden arren, bi-hiru eguneko jolasaren emaitza da hau.
Sistemak ordu erdian behin #hitzokei etiketadun mezuen emaitzak jasotzen ditu eta definizio bat detektatuz gero gorde egiten du.
Definizioak detektatzeko ondorengoak hartzen dira kontuan:
Mezuak automatikoki jasotzean, muga batzuk ere aintzat hartu behar dira, eguneraketak babestuak dituzten erabiltzaileen mezuak ezin direla jaso, adibidez.
Noski, negatibo faltsuak gerta daitezkeenez eta joko hau hasi zenetik eman diren hitz guztiak automatikoki jasotzea ezinezkoa denez, hitz berria gehitzeko inprimakia dago.
Garapena Pythonez egin dut, erraza izateaz gain eskaintzen dituen liburutegiekin praktikoki edozer egin daitekeelako.
Webeko kontuetan erraztasun handiak ematen dituelako, Django frameworkarekin aritu naiz lanean. APIarekin lan egiteko zuzenean simplejson liburutegia erabili dut (inolako wrapperik gabe), JSON formatuko emaitza primeran konpontzen baita Pythonekin.
Terminoen eguneraketa automatikoak egiteaz cron ataza bat arduratzen da. Eta gainerakoan ez dago sekretu handiegirik.
Iturburu-kodea githuben jarri dut edonork kuxkuxeatzeko moduan. Bi zati daude:
Esan gabe doa partxeak onartzen direla!