accented character | aksara bertanda | Huruf, angka, simbol dan lain-lain yang mempunyai tanda diakritik yang ditambahkan pada huruf, angka atau simbol tersebut untuk memberi nilai linguistik tertentu. Dalam korpus, aksara bertanda ini perlu dikodkan dengan penggunaan simbol ‘&’ untuk permulaa |
alphanumeric | abjad angka/alfanumerik | Kombinasi huruf dan angka termasuk simbol matematik dan tanda baca. |
ambiguity | ketaksaan/ambiguiti | Kekaburan dalam menentukan tanda yang perlu diberikan dalam proses anotasi korpus. |
annotation | anotasi | Penandaan maklumat linguistik pada korpus seperti penandaan golongan kata, morfologi, prosodi dan semantik. |
anonymisation | penyahnamaan | Pengguguran identiti pengarang pada teks terpilih dalam proses penyediaan data korpus. |
AntConc | AntConc | Perisian analisis korpus yang mempunyai pelbagai fungsi seperti carian kata kunci, konkordans, kolokasi, n-gram serta janaan senarai kata. |
approximate string matching | pemadanan rentetan hampiran | Kaedah mendapatkan semula maklumat menggunakan carian rentetan yang menghampiri kata yang dicari. Contohnya, carian dalam teks untuk kata ‘kerajaan’ menggunakan kaedah pemadanan rentetan hampiran akan turut menghasilkan ralat kata seperti ‘kerjaan’, ‘krej |
ASCII | ASCII | Kod standard berasaskan tujuh (7) bit yang lazim digunakan dalam komputer untuk mewakilkan aksara. |