Lexikální databáze humanistické a barokní češtiny

má dvojí funkci:

  1. 1) podává elementární přehled o české slovní zásobě mezi léty 1500–1780 a rozšiřuje a prohlubuje její celkový obraz ustavený především Slovníkem česko-německým Josefa Jungmanna;
  2. 2) představuje první krok při budování materiálové základny, z níž bude možno sestavit slovník češtiny uvedeného období, popř. jiné příručky.

Přístup k databázi

Databáze je plně přístupná registrovaným uživatelům z řad odborníků, kteří na mailové adrese madla(zavináč)ujc.cas.cz požádají o zřízení uživatelského účtu. Informace o tom, jak mohou s databází pracovat, jsou umístěny v záložce Nápověda.

Struktura databázového záznamu

Databázi tvoří více než tři čtvrti milionu záznamů. Každý z nich obsahuje jednak naskenovaný excerpční lístek, jednak počítačově čitelné údaje.

Z těchto údajů jsou obligatorně uvedeny:

  1. A) lemma (heslové slovo) – systémová („slovníková“) podoba zachycené lexikální jednotky; zaznamenáváme ji v hláskové a morfematické podobě, kterou předpokládáme k roku 1500 (s výjimkou lexikálních jednotek zaznamenaných prokazatelně mnohem později); s ohledem na dlouhé trvání průběhu jednotlivých hláskových změn se při tom opíráme o údaje obsažené v historických mluvnicích a také o vlastní poznatky získané při studiu daného materiálu;
  2. B) heslo (textová realizace heslového slova) – doložená podoba lexikální jednotky; v ní zachováváme autentickou hláskovou podobu slova zachycenou v prameni, která může být značně odlišná od standardní podoby slova, tj. od lemmatu (střen – stržen);
  3. C) pramen (signalizovaný příslušnou zkratkou).

Výběrově se uvádějí další doprovodné údaje:

  1. D) o dokladu: jeho bližší určení (strana nebo folio zdrojového dokumentu; u listin apod. rok vzniku textu; díl edice nebo ročník časopisu; u biblických textů biblické místo; poznámka k zachycené podobě či míře spolehlivosti zápisu; u přejatých slov informace o jejich původu atd.);
  2. E) o pramenu: autor díla; zpracovatel (popř. upravovatel, překladatel apod.) textu; název a popis díla; uložení zdrojového dokumentu podle knihovní signatury; novodobé edice atd.

Zásady zpracování lexikálních jednotek v databázi

Pojetí lexikálních jednotek jako součástí lexikálního systému odpovídá v hrubých rysech koncepci nedokončeného Staročeského slovníku (Staročeský slovník 1–26, 1968–2008): lexikální jednotka je výraz mající svébytnou formu a svébytný obsah (Staročeský slovník. Úvodní stati, soupis pramenů a zkratek, Praha 1968, str. 20–22). Jako heslové slovo tedy chápeme samostatnou slovní formu, jíž je přiřazen minimálně jeden samostatný lexikální význam.

Protože výsledným dílem je pouze materiálová databáze, nikoli vlastní slovník, je toto vymezení uplatněno jen v základních obrysech: lexikální jednotku v databázi zpracováváme jako jedno heslové slovo bez ohledu na to, kolik má významů; ty (v případě polysémních slov) nevydělujeme, protože podrobná sémantická analýza má smysl teprve při komplexním lexikografickém zpracování veškeré slovní zásoby, které však musí vycházet z většího množství jazykového materiálu. Nesignalizujeme ani – ať předpokládaná, ať nepochybná – homonyma (hýl, plýtvati).

Jako samostatné lexikální jednotky nezaznamenáváme lexikalizovaná spojení, a to ani tehdy, je-li výskyt lexému omezen pouze na ně (dáti na pamětnou – viz pamětná) – jednotlivé části lexikalizovaných spojení zaznamenáváme zvlášť (z komára dělati velblouda – viz komár a velbloud), nebo spojení řadíme alespoň k členu diferencujícímu (nestáti za balatku – viz balatka).

Za samostatné lexikální jednotky však považujeme vlastní jména, a to i tehdy, jsou-li formálně identická s apelativy (Pekárek i pekárek). Přídavná jména tvořící součást vlastních jmen ve víceslovném spojení řadíme vždy pod příslušné apelativní lemma (Harfové moře – viz harfový).

Součástí databáze nejsou cizojazyčná slova užitá jako citátová.

Způsob zápisu lexikálních jednotek do databáze

Lexikální jednotky uvádíme v tzv. slovníkové podobě (tj. u skloňovaných slov v 1. pádu jednotného čísla, u slov rodově rozlišených v 1. pádu jednotného čísla mužského rodu, u sloves v infinitivu). Výjimkou jsou podstatná jména pomnožná (dveře) a zpodstatnělá přídavná jména omezená na určitý jmenný rod, např. pojmenování poplatků (parožné) nebo označení dějů apod. (čekaná, pomyšlená, zkušená).

Jak lemma, tak heslo transkribujeme – uživatel tedy při hledání nemůže zadávat podobu lexikální jednotky zaznamenanou původním pravopisem (např. segr, woda). Částečnou výjimku tvoří slova přejatá (především z latiny a němčiny): při určování jejich lemmatu přihlížíme k předpokládané míře jejich začlenění do českého lexikálního systému. Protože v dobových zápisech bývají tato slova zapisována velmi nejednotně a protože také dnešní editoři k nim přistupují rozdílně, uvádíme je v hesle v té podobě, jaká je podle excerptora uvedena v daném prameni (cavaglier, exsequutor, sophistycský – viz kavalér, exekutor, sofistický). V hesle také zachováváme doložený výskyt digrafu au, neboť jej chápeme jako zápis přechodné fáze při vzniku dvojhlásky ou (dlauhost).

Obtíže při stanovení lemmatu i hesla často působí délka samohlásek, která nebývá ve zdrojových textech důsledně značena a s níž ani novodobí editoři nezacházejí jednotně; v rámci některých slovních čeledí nebo slovotvorných typů jsme proto zvolili individuální přístup k jejich zpracování, který zohledňuje stáří jednotlivých slov, jejich jedinečný vývoj, systémové tlaky uvnitř lexikálního systému, možné nářeční vlivy atd. Protože však naším cílem není podat obraz konkrétního textu, ale obraz veškeré slovní zásoby, obecně se v otázkách samohláskové délky řídíme původem a slovotvornou stavbou slova. Opírali jsme se rovněž o rukopis nevydané monografie Milady Nedvědové Kvantita samohlásek ve starší češtině.

Vznik databáze

Lexikální databáze humanistické a barokní češtiny byla vytvořena na základě několika lístkových kartoték, které jsou v majetku Ústavu pro jazyk český AV ČR. Vznikala v letech 2005–2012 při řešení projektu Slovní zásoba češtiny doby střední – „editio princeps“ (analýza lexikálního materiálu a jeho zpřístupnění v elektronické formě) v programu „Podpora projektů cíleného výzkumu“ (č. 1QS900610505) a grantového projektu Grantové agentury ČR Česká slovní zásoba v období humanismu a baroka: vývojové aspekty (č. P406/10/1165). V letech 2005–2011 práci podpořilo Výzkumné centrum vývoje staré a střední češtiny (č. LC 546) Ministerstva školství, mládeže a tělovýchovy České republiky.

Lexikální databáze humanistické a barokní češtiny je dílem několika členů oddělení vývoje jazyka Ústavu pro jazyk český AV ČR. Po celou dobu na úkolu pracovali Petr Nejedlý (řešitel projektů), Miloslava Vajdlová a Věra Chládková. V různých fázích projektu se prací dále účastnili (v abecedním pořadí) Irena Fuková, Kateřina Heřmanská, Barbora Chybová, Zuzana Jasanská, Lucie Korbélyiová, František Martínek, Barbora Poledňáková, Kateřina Rysová, Klára Šatanová, Kateřina Ulmanová a Eva Záhořová; databázi po stránce programové připravil Boris Lehečka.

Na práci se různou měrou dále podíleli studentky a studenti (převážně z Filozofické fakulty Univerzity Karlovy) Nea Brkičová, Hana Bulejová, Jana Česká, Eliška Davidová, Jana Eichlerová, Magdalena Fottová, Libuše Hronková, Veronika Jáchimová, Zuzana Janovská, Kateřina Kubová, Miloslava Landová, Aneta Machálková, Tereza Mudrová, Vladěna Ondoková, Ludmila Pechová, Gabriela Romanová, Magdaléna Rysová, Helena Sellnerová, Dagmar Schafferová, Jana Sieberová, Klára Soukupová, Jana Stillerová, Michal Strnad, Monika Markéta Šmídová, Michaela Štěchová (Hájková), Zuzana Šullová, Rostislav Taud a Anna Vandasová.

Skenování lístkových kartoték provedla firma Imaging Systems vedená Alešem Konarovským. Odborné konzultace k nejfrekventovanějším použitým literárním pramenům poskytl Jan Malura z Ostravské univerzity.

Přejeme uživatelům databáze, aby jim posloužila v jejich práci. Jejich případné připomínky a podněty zároveň přispějí k zpřesnění a k rozšíření dosavadních poznatků o slovní zásobě humanistické a barokní češtiny.

Jsme si dobře vědomi, kolik otázek v tomto oboru ještě není vyřešeno, a jsme připraveni se jimi dále zabývat. Aby však mohl příslušný výzkum pokračovat (a být finančně podporován), je třeba prokázat jeho potřebnost standardním způsobem, tj. mimo jiné citací použitého díla. Je tedy též v zájmu uživatelů, budou-li na databázi ve svých pracích náležitě odkazovat (viz záložka Jak citovat).