- (NorHashimah)
- (2003)
Nor Hashimah Jalaluddin. 2003. Bahasa dalam Perniagaan: Satu Analisis Semantik dan Pragmatik. Kuala Lumpur: Dewan Bahasa dan Pustaka. - (2005)
Nor Hashimah Jalaluddin, Harishon Radzi, Maslida Yusof, Raja Masittah Raja Ariffin dan Sa’adiah Ma’alip. 2005. Sistem Panggilan dalam Keluarga Melayu: Satu Dokumentasi. Kuala Lumpur: Dewan Bahasa dan Pustaka.
- (2003)
- Hiroki Nomoto. 2018. Korpus Variasi Bahasa Melayu: Standard Lisan.
- (Untuk anotasi pengganti ganti nama [pronoun substitute])
Nomoto, Hiroki, Ryuko Taniguchi, Shiori Nakamura, Yunjin Nam, Sri Budi Lestari, Sunisa Wittayapanyanon (Saito), Virach Sornlertlamvanich, Atsushi Kasuga, Kenji Okano dan Thuzar Hlaing. 2023. Pronoun substitute annotation in seven Asian languages. Proceedings of the Twenty-Ninth Annual Meeting of the Association for Natural Language Processing, 2242-2247. - (Untuk anotasi ganti nama kosong)
Nomoto, Hiroki, Farhan Athirah binti Abdul Razak dan Kohei Fujita. 2025. Zero pronoun annotation in Malay and beyond. Proceedings of the Thirty-First Annual Meeting of the Association for Natural Language Processing, 391-396.
Creative Commons Attribution 4.0 International (CC BY 4.0)
| Fail | Topik | Jenis | Durasi | Jumlah token | ID penutur | Tempat asal penutur |
|---|---|---|---|---|---|---|
| KL201701 | Musang dan gagak (dengan gambar) | Monolog | 2:21 | 235 | 1 | Johor |
| KL201702 | Musang dan gagak (tanpa gambar) | Monolog | 1:30 | 182 | 1 | Johor |
| KL201703 | Musang dan gagak (sebagai watak) | Monolog | 1:27 | 182 | 1 | Johor |
| KL201704 | Musang dan gagak (dengan gambar) | Monolog | 1:31 | 175 | 2 | Johor |
| KL201705 | Musang dan gagak (tanpa gambar) | Monolog | 1:19 | 165 | 2 | Johor |
| KL201706 | Musang dan gagak (sebagai watak) | Monolog | 1:09 | 145 | 2 | Johor |
| KL201707 | Cerita gembira | Monolog | 1:03 | 135 | 2 | Johor |
| KL201708 | Cerita sedih | Monolog | 0:51 | 103 | 2 | Johor |
| KL201709 | Cerita rakyat | Monolog | 3:26 | 417 | 2 | Johor |
| KL201710 | Cerita gembira | Monolog | 1:21 | 181 | 1 | Johor |
| KL201711 | Cerita sedih | Monolog | 1:25 | 161 | 1 | Johor |
| KL201712 | Cerita rakyat | Monolog | 3:07 | 378 | 1 | Johor |
| KL201713 | Cerita gembira | Monolog | 0:55 | 129 | 3 | Kuala Lumpur |
| KL201714 | Cerita sedih | Monolog | 1:50 | 225 | 3 | Kuala Lumpur |
| KL201715 | Cerita rakyat | Monolog | 2:56 | 364 | 3 | Kuala Lumpur |
| KL201716 | Musang dan gagak (dengan gambar) | Monolog | 1:31 | 179 | 4 | Negeri Sembilan |
| KL201717 | Musang dan gagak (tanpa gambar) | Monolog | 0:56 | 150 | 4 | Negeri Sembilan |
| KL201718 | Musang dan gagak (sebagai watak) | Monolog | 1:46 | 209 | 4 | Negeri Sembilan |
| KL201719 | Cerita gembira | Monolog | 0:45 | 117 | 4 | Negeri Sembilan |
| KL201720 | Cerita sedih | Monolog | 1:27 | 259 | 4 | Negeri Sembilan |
| KL201721 | Cerita rakyat | Monolog | 1:52 | 267 | 4 | Negeri Sembilan |
| KL201722 | Musang dan gagak (dengan gambar) | Monolog | 1:37 | 167 | 5 | Negeri Sembilan |
| KL201723 | Musang dan gagak (tanpa gambar) | Monolog | 1:08 | 120 | 5 | Negeri Sembilan |
| KL201724 | Musang dan gagak (sebagai watak) | Monolog | 1:40 | 181 | 5 | Negeri Sembilan |
| KL201725 | Cerita gembira | Monolog | 0:43 | 93 | 5 | Negeri Sembilan |
| KL201726 | Cerita sedih | Monolog | 1:03 | 148 | 5 | Negeri Sembilan |
| KL201727 | Cerita rakyat | Monolog | 1:44 | 220 | 5 | Negeri Sembilan |
| KL201728 | Musang dan gagak (dengan gambar) | Monolog | 1:03 | 132 | 6 | Sabah |
| KL201729 | Musang dan gagak (tanpa gambar) | Monolog | 0:45 | 100 | 6 | Sabah |
| KL201730 | Musang dan gagak (sebagai watak) | Monolog | 1:55 | 239 | 6 | Sabah |
| KL201731 | Cerita gembira | Monolog | 0:38 | 67 | 6 | Sabah |
| KL201732 | Cerita sedih | Monolog | 1:09 | 153 | 6 | Sabah |
| KL201733 | Cerita rakyat (Huminodun) | Monolog | 1:29 | 183 | 6 | Sabah |
| Jumlah | 49:22 | 6,161 |
- /// = hentian sejenak
- < > = ujaran serentak
- ### = tidak jelas
- PN = nama peribadi
XXX.txtteks asal tanpa anotasiXXX-prodrop.jsonlanotasi ganti nama kosong dalam format jsonlXXX-prodrop.txtanotasi ganti nama kosong dalam format yang dibataskan tabXXX-prodrop_inserted.txtteks asal dengan tag anotasi disisipkanXXX-prosub.jsonlanotatsi pengganti ganti nama dalam format jsonlXXX-prosub.txtanotatsi pengganti ganti nama dalam format yang dibataskan tab
Fail anotasi dalam format yang dibataskan tab (XXX-prodrop.txt dan XXX-prosub.txt) boleh disuap kepada ETA: Easy Text Annotator bersama dengan fail teks asal (XXX.txt) untuk memvisualisasikan anotasi dalam pelayar. Dengan menggunakan ETA, anda juga mengubah anotasi dan menjana jadual ringkasan anotasi yang boleh dibukan dengan MS Excel dan sebagainya.
Anotasi diberi token selepas kedudukan ganti nama kosong (zero pronoun).
1storang pertama2ndorang kedua3rdorang ketigaSsubjekDOobjek langsungIOobjek tak langsungPpemilik
Lihat Nomoto dkk. (2025) untuk maklumat lanjut.
Anotasi diberi pada ungkapan-ungkapan yang merujuk kepada penutur dan pendengar, baik ganti nama (pronoun) mahupun pengganti ganti nama (pronoun substitute), serta ungkapan panggilan (address term).
1stkata ganti nama dan pengganti ganti nama yang orang pertama2ndorang keduaaddressungkapan panggilan
Lihat Nomoto dkk. (2023) untuk maklumat lanjut.