Předmět: Úvod do českého národního korpusu

« Zpět
Název předmětu Úvod do českého národního korpusu
Kód předmětu KBO/4056
Organizační forma výuky Seminář
Úroveň předmětu Bakalářský
Rok studia nespecifikován
Semestr Zimní
Počet ECTS kreditů 2
Vyučovací jazyk Čeština
Statut předmětu Povinně-volitelný
Způsob výuky Kontaktní
Studijní praxe Nejedná se o pracovní stáž
Doporučené volitelné součásti programu Není
Dostupnost předmětu Předmět je nabízen přijíždějícím studentům
Vyučující
  • Marvanová Mira, PhDr. Ph.D.
Obsah předmětu
1. Seznámení s korpusovou lingvistikou. Druhy dostupných korpusů. Principy sestavení elektronického jazykového korpusu. Prezentace ČNK a jeho dokumentace. 2. Představení korpusového manažeru a jeho nastavení. Ukázky úkolů. 3. Základní terminologie a pojmy korpusového manažeru. Cvičná zadání. 4. Způsoby vyhledávání v korpusu. Grafické vytváření dotazů. Řešení cvičných úkolů. 5. Funkce "zobrazení" zdrojů, atributů, struktur, kontextu a rozsahu vyhledávaných jednotek. Řešení cvičných úkolů. 6. Způsoby uložení a exportu získané informace, její redukce a třídění. Řešení cvičných úkolů. 7. Přístupy k statistickým funkcím korpusu - frekvenční distribuce, kolokace, rozložení. Řešení cvičných úkolů. 8. Průzkum variant v synchronní a diachronní perspektivě pomocí aplikací SyD. Další aplikace korpusového výzkumů ČNK - KWords a Morfio. Řešení cvičných úkolů. 9. Práce s "pojmenovanými dotazy" a s "předlohami". Řešení cvičných úkolů. 10. Zadání seminární práce a demonstrace jednotlivých postupů při jejím řešení. Řešení analogických cvičných úkolů. 11. Řešení komplexních korpusových úkolů některých konkrétních jazykových jevů z různých rovin výzkumu jazyka: pravopisu, morfologie, lexikologie, tvoření slov, syntaxe aj. 12. Aplikace práce s ČNK ve škole při výuce češtiny. Řešení komplexních korpusových úkolů některých konkrétních jazykových jevů z pravopisu, morfologie, lexikologie a tvoření slov, syntaxe aj. 13. Další elektronické databáze češtiny, paralelní korpus InterCorpa ukázka práce s komputačními korpusy některých cizích jazyků. 14. Závěrečný seminář s hodnocením výuky.

Studijní aktivity a metody výuky
Monologická (výklad, přednáška, instruktáž), Dialogická (diskuze, rozhovor, brainstorming)
Výstupy z učení
Kurs seznamuje studenty s primární a největší elektronickou databází češtiny - ČNK (pro současný jazyk obsahující doposud již jednu miliardu textových slov), která má řadu aplikací jak pro každého bohemistu, spisovatele, novináře, překladatele apod., tak i pro širokou škálu zájemců z jiných oborů. Na seminářích student získává kompetence jak s korpusem pracovat a využívat odborně široké možnosti korpusového manažeru. Po seznámení se se speciální korpusovou komputační terminologií a osvojení nabídky jednotlivých funkcí korpusu se postupně přechází k různým cvičným úkolům, které zkoumají výskyt, užití, kolokabilitu (okolí a syntagmatiku), frekvenci různých slov, jejich tvarů nebo dublet, gramatických a stylistických jevů, především v současné češtině. Při výuce se používají synchronní on-line verze velkých korpusu: SYN 2000/2005/2010 a SYN 2006PUB/2009PUB a jejich souhrnná sjednocená verze SYN, paralelní (vícejazyčný) korpus InterCorp a některé další aplikace jako např. SyD pro průzkum variant, Morfio pro výzkum slovotvorných modelů a KWords pro textologickou identifikaci klíčových slov v textu.
Student se stává aktivním uživatelem elektronické databáze Českého národního korpusu a je schopen s ním kompetentně pracovat, tj. získávat informace a následně analyzovat různé jazykové a sociolingvistické jevy v češtině. Kurs představuje nezbytnou složku moderního vnímání češtiny každého češtináře a má rovněž uplatnění nejen při výzkumné práci, ale i při výuce hodin českého jazyka ve škole či při tvůrčí autorské, editorské a redaktorské práci s jazykem.
Předpoklady
znalosti disciplíny na maturitní úrovni znalosti v rámci oborové návaznosti náležitá terminologie

Hodnoticí metody a kritéria
Analýza výkonů studenta

docházka aktivita samostatný výstup test
Doporučená literatura
  • Dokumentace a Manuál ČNK [dostupnénawww.korpus.cz nebo na www.ucnk.ff.cuni.cz].
  • Čermák, F. - Blatná, R. a kol. Jak využívat český národní korpus. Praha: NLN, 2005.
  • Čermák, F. - Blatná, R. (eds.). Korpusová lingvistika: Stav a modelové přístupy. Praha: NLN - ÚČNK, 2006.
  • Kocek, J. - Kopřivová, M. - Kučera, K. (eds). Český národní korpus. Úvod a příručka uživatele. Praha: FF UK - ÚČNK, 2000.


Studijní plány, ve kterých se předmět nachází
Fakulta Studijní plán (Verze) Kategorie studijního oboru/specializace Doporučený ročník Doporučený semestr
Fakulta: Pedagogická fakulta Studijní plán (Verze): Český jazyk a literatura (jednooborové) (A14) Kategorie: Filologické vědy 3 Doporučený ročník:3, Doporučený semestr: Zimní