📄️ Elektroniczny korpus tekstów polskich z XVII i XVIII w. (do 1772 r.)
Elektroniczny Korpus Tekstów Polskich XVII i XVIII w. (do 1772 r.), w skrócie nazywany KorBą (akronim wyrażenia korpus barokowy), jest najważniejszym rezultatem projektu realizowanego w latach 2013-2018 przez Pracownię Historii Języka Polskiego XVII i XVIII w. Instytutu Języka Polskiego PAN we współpracy z Zespołem Inżynierii Lingwistycznej w Instytucie Podstaw Informatyki PAN. Zgromadzone w nim teksty prezentowane są w formie transkrypcji i transliteracji. Bogate metadane, znakowanie strukturalne i językowe oraz anotacja morfosyntaktyczna i lematyzacja dają możliwość zadawania różnorakich zapytań, filtrowania wyników oraz ich lokalizacji w źródle z dokładnością do numeru strony.
📄️ Korpus tekstów polskich z lat 1830-1918
Korpus prezentowany na niniejszej stronie jest ręcznie znakowanym fleksyjnie podzbiorem korpusu zgromadzonego w ramach projektu Automatyczna analiza fleksyjna tekstów polskich z lat 1830-1918 z uwzględnieniem zmian w odmianie i pisowni. Oryginalny korpus ma wielkość ponad 1 miliona słów i został podzielny w równych proporcjach na pięć podkorpusów reprezentujących style funkcjonalne: popularnonaukowy, drobne wiadomości prasowe, publicystykę, prozę i dramat. Do ręcznej anotacji wybrano z niego 2944 próbki długości około 160 słów przy jednoczesnym zachowaniu proporcji stylów funkcjonalnych. W efekcie powstał ręcznie znakowany korpus obejmujący mniej więcej połowę oryginalnego zbioru (około 500 tys. słów, 625 tys. segmentów).
📄️ Korpus sejmikowy: dokumenty sejmikowe Rzeczypospolitej przedrozbiorowej
Korpus dokumentów sejmikowych Rzeczypospolitej przedrozbiorowej ma na celu zebranie wszystkich uchwał (laudów) sejmikowych sprzed 1795 roku, na ile ich wydania są dostępne i ich udostępnienie nie jest zakazane przez prawa autorskie. Poza tym korpus włącza inne dokumenty związane z sejmikami (listy króla i innych osób do sejmiku, dokumenty wydawane przez instytucje odpowiedzialne przed sejmikami) – jeżeli takie dokumenty wydane zostały razem z laudami sejmikowymi.