Skip to content

Projekt TAŚKA

Przikłŏd wyszukowaniŏ we korpusie
Przikłŏd wyszukowaniŏ we korpusie

Co to je korpus? To je zbiōr tekstōw we jakijś gŏdce dlŏ testowaniŏ statystycznych hipotez, sprawdzaniŏ wystōmpiyń i weryfikowaniŏ prawideł gŏdki. Analizōm korpusu idzie zbadać jake ino mustry sie chce: leksykalne, strukturalne, fōnologiczne, morfologiczne. Idzie aji zbadać rōżnice miyndzy tym, jak gŏdajōm kobiyty i chopy. Korpus może tyż pōmōc przi uczyniu gŏdki.

TAŚKA to skrōt ôd Tekstowy Autōnōmiczny Ślōnski Korpus Anotowany.

Tekstowy, bo zbiyrŏ ślōnske teksty, coby skōmpletować z nich korpus. Robota na razie ôpiyrŏ sie na tekstach starych, ôd XVI do połowy XX stoleciŏ. Sōm ône rōżnyj dugości: ôd pōł strōny do wiyncyj jak dwiestu strōn. Podle rachōnkōw tajla ôpartŏ na starych tekstach bydzie zawiyrać kole 250 tysiyncy słōw. Po skōńczyniu roboty nad starymi tekstami we planie je sebranie tyż tekstōw nowszych. Nowsze teksty sōm dodŏwane ôd 6 marca, chociŏż robota nad starszymi trwŏ.

Autōnōmiczny, bo chociŏż cyl je naukowy, to projekt je niyznŏleżny ôd żŏdnyj instytucyje naukowyj. Bydzie ôn kōnsulowany ze profesjōnalistami, ale kōńcowŏ forma bydzie mu nadanŏ ôd autora.

Anotowany, bo kożde słowo we korpusie mŏ być ôpisane. Przikłŏd:

pisza pisać.verb.imperf.pres.p1.sg

pisać to je forma bazowŏ, verb znaczy, że to czasownik, imperf znaczy, że je niydokōnany, pres znaczy, że dzieje sie terŏz, p1 znaczy, że to piyrszŏ ôsoba, sg znaczy, że to liczba pojedynczŏ.

Na 16 lutego 2017 fertich je 10744 słōw tekstu.

Na 23 lutego 2017: 13476 słōw.

Na 24 lutego 2017: 23789 słōw.

Na 25 lutego 2017: 24950 słōw.

Na 27 lutego 2017: 34627 słōw.

Na 1 marca 2017: 51280 słōw.

Na 2 marca 2017: 90521 słōw.

Na 3 marca 2017: 96884 słowa.

Na 4 marca 2017: 106637 słōw.

Na 6 marca 2017: 143107 słōw.

Na 7 marca 2017: 318972 słowa.

Na 9 marca 2017: 335482 słowa.

Na 10 marca 2017: 341723 słowa.

Na 16 marca 2017: 466319 słōw.

Na 18 marca 2017: 481773 słōw.

Na 19 marca 2017: 809398 słōw.

Na 29 marca 2017: 876930 słōw.

Na 18 kwietnia 2017: 1032591 słōw.

Na 4 czerwca 2017: 1615737 słōw.

Na 21 listopada 2017: 1814988 słōw.