Glosari Linguistik: Linguistik Korpus ini merupakan terbitan Dewan Bahasa dan Pustaka yang mengandungi 259 istilah sumber dan 274 istilah sasaran. Istilah dalam glosari ini telah digubal, disemak dan disahkan oleh Jawatankuasa Istilah (JKI) Linguistik: Linguistik Korpus yang terdiri daripada pakar-pakar dalam bidang linguistik korpus.
Pembentukan istilah dalam bidang ini juga berpandukan Pedoman Umum Pembentukan Istilah Bahasa Melayu Edisi Baharu (DBP, 2005), Pedoman Umum Ejaan Bahasa Melayu (DBP, 1992), Daftar Kata Bahasa Melayu, Rumi-Sebutan-Jawi, Edisi Kedua (DBP, 2016), dan Terminology Manual (UNESCO, 1984).
Glosari ini mengandungi istilah sumber dan istilah sasar berserta dengan huraian yang padat dan ringkas. Glosari ini sesuai dijadikan rujukan kepada pengajar, pelajar dan pengamal dalam bidang linguistik korpus.
Perunding Portal
1.Istilah sumber (BI) disenaraikan menurut abjad Rumi, bukan menurut subbidang.
authentic text (teks tulen)
Teks sebenar yang terbentuk secara tabii dan bukan merupakan data rekaan pengkaji.
fixed expression (ungkapan tetap)
Gabungan dua perkataan atau lebih yang membentuk satu unit makna.
word list (senarai kata)
Tanda bernombor pada huraian bermaksud istilah sasaran (BM) melambangkan konsep yang lebih daripada satu, menurut keperihalan yang berlainan atau melambangkan keperihalan konsep yang berlainan tetapi dilambangkan dengan satu istilah bahasa sasaran sahaja.
Contoh:
cluster (gugusan)
1. Satu kelompok rangkai kata.
2. Satu kelompok teks dengan ciri linguistik yang sama.
balanced corpus (korpus seimbang)
1. Himpunan data bahasa yang terdiri daripada pelbagai genre dan domain teks yang merangkumi bahasa lisan dan tulisan untuk dijadikan sebagai korpus rujukan.
2. Korpus yang telah mencapai ketepuan tipa kata. Kebarangkalian muncul kata unik baharu adalah sangat rendah dengan penambahan saiz korpus.
Tanda (/) bermaksud dua atau lebih istilah sasaran (BM) mempunyai makna atau konsep yang sama tetapi bentuknya berlainan (sinonim). Istilah ini dipadankan dengan hanya satu istilah dalam istilah sumber (BI).
ambiguity (ketaksaan/ambiguiti)
granularity (darjah pemerincian/granulariti)
Tahap pemerincian kategori dalam skema anotasi yang digunakan.
Bagi istilah bersinonim, bentuk yang lazim digunakan sahaja yang diberikan huraian. Bentuk yang kurang lazim penggunaannya diletakkan pada hujung huraian. Istilah yang kurang lazim penggunaannya ini, bagaimanapun dimuatkan juga sebagai entri baharu yang dirujuksilangkan kepada bentuk yang lazim digunakan.
dynamic corpus (korpus dinamik)
Korpus yang saiznya semakin bertambah dari semasa ke semasa bagi meneliti perubahan bahasa dan dikenali juga sebagai korpora pemantau. Sinonim monitor corpus.
Tanda Lihat bermaksud istilah sasaran (BM) melambangkan konsep huraian istilah sumber (BI) yang sama dengan istilah yang dirujuk silang.
discourse prosody (prosodi wacana)
Lihat semantic prosody.
monitor corpus (korpus pemantau)
Lihat dynamic corpus.
Tanda Lihat juga bermaksud konsep istilah sumber (BI) mempunyai kaitan rapat dengan istilah sumber (BI) lain yang dirujuk silang.
data (data)
Maklumat dalam bentuk teks atau analisis seperti perkataan, statistik, konkordans, atau kolokasi yang dijana daripada korpora.Lihat juga intuitive data, attested data, modified data.
Kata Banding bermaksud istilah yang dirujuksilangkan mendukung konsep yang berlawanan dengan entri yang berkenaan
diachronic corpus (korpus diakronik)
Korpus yang mengandungi himpunan teks masa lampau yang tertentu untuk meneliti perubahan bahasa.Banding synchronic corpus.
synchronic corpus korpus sinkronik
Korpus yang mengandungi himpunan teks yang dihasilkan dalam tempoh sama bagi menggambarkan penggunaan bahasa pada masa tersebut.Banding diachronic corpus.