Video: Closed Captioning: More Ingenious than You Know 2025
Apabila bekerja dengan teks dalam R, anda mungkin perlu mencari perkataan atau pola di dalam teks. Bayangkan anda mempunyai senarai negeri-negeri di Amerika Syarikat, dan anda ingin mengetahui nama negara mana yang mengandungi dua perkataan.
Untuk mencari substrings, anda boleh menggunakan fungsi grep (), yang mengambil dua hujah penting:
-
corak : Corak yang anda ingin cari.
-
x : Vector watak yang anda mahu cari.
Jadi, bagaimana anda mencari nama semua negeri dengan lebih daripada satu perkataan? Ini mudah apabila anda menyedari bahawa anda boleh membingkai soalan dengan mencari semua negeri yang mengandungi ruang: >> menyatakan. "New York" "New Jersey" [3] "New Mexico" "New York" [5] "North Carolina" "North Dakota" [7] "Rhode "South Carolina" [9] "South Dakota" "West Virginia"
Hasilnya meliputi semua negeri yang mempunyai nama dua kata, seperti New Jersey, New York, North Carolina, South Dakota, dan West Virginia.
Timur. Anda boleh mengesahkannya dengan melakukan carian lain: >> menyatakan. Nama [grep ("Timur", nyatakan nama)] aksara (0) Apabila hasil operasi aksara adalah vektor kosong (iaitu, tiada apa-apa di dalamnya), R mewakilinya sebagai aksara (0). Begitu juga, kosong, atau sifar-panjang, vektor angka diwakili dengan integer (0) atau angka (0).
R membuat perbezaan antara NULL dan vektor kosong. NULL biasanya bermakna sesuatu tidak dapat ditentukan. Ini berbeza dengan sesuatu yang kosong. Contohnya, vektor watak yang tidak mempunyai unsur masih merupakan vektor aksara yang diwakili oleh aksara (0).
