Video: Data Analysis in R by Dustin Tran 2024
Untuk analisis ramalan, anda perlu memuatkan data untuk algoritma anda untuk digunakan. Memuatkan dataset Iris dalam scikit semudah mengeluarkan beberapa baris kod kerana scikit telah mencipta fungsi untuk memuatkan dataset.
Sepal Panjang | Sepal Lebar | Panjang Petal | Lebar Petal | Kelas Sasaran / Label |
---|---|---|---|---|
5. 1 | 3. 5 | 1. 4 | 0. 2 | Setosa (0) |
7. 0 | 3. 2 | 4. 7 | 1. 4 | Versicolor (1) |
6. 3 | 3. 3 | 6. 0 | 2. 5 | Virginica (2) |
-
Buka sesi shell interaktif Python baru.
Gunakan sesi Python baru supaya tidak ada apa-apa yang tersisa dalam memori dan anda mempunyai slate bersih untuk bekerja dengan.
-
Masukkan kod berikut dalam prompt dan perhatikan output: >>>> dari sklearn. dataset import load_iris >>> iris = load_iris ()
Setelah menjalankan kedua-dua pernyataan, anda tidak sepatutnya melihat apa-apa mesej dari jurubahasa. Iris pembolehubah harus mengandungi semua data dari iris. fail csv.
Output akan semua kandungan dari iris. fail csv, bersama-sama dengan beberapa maklumat lain mengenai dataset bahawa fungsi load_iris dimuatkan ke pembolehubah. Pembolehubah adalah struktur data kamus dengan empat sifat utama. Ciri-ciri penting iris disenaraikan di bawah.
Nama Harta
Deskripsidata | Mengandungi semua pengukuran pemerhatian. |
---|---|
feature_name | Mengandungi nama ciri (nama atribut). |
sasaran | Mengandungi semua sasaran (label) pemerhatian. |
target_names | Mengandungi nama kelas. |
Anda boleh mencetak nilai dalam jurubahasa dengan menaip nama pembolehubah diikuti oleh dot diikuti dengan nama harta. Contohnya ialah menggunakan iris. data untuk mengakses harta iris, seperti ini: >>>> iris. data | Ini adalah cara standard untuk mengakses sifat sesuatu objek dalam banyak bahasa pengaturcaraan. |
Untuk membuat contoh pengelas SVM, ketik kod berikut dalam penterjemah: >>>> dari sklearn. svm import LinearSVC >>> svmClassifier = LinearSVC (random_state = 111)
Baris pertama kod import pustaka Linear SVC ke dalam sesi. Klasifikasi Vektor Sokongan linear (SVC) adalah pelaksanaan SVM untuk klasifikasi linier dan mempunyai sokongan multi-kelas.Dataset ini agak boleh dipisahkan secara linier dan mempunyai tiga kelas, jadi ide yang baik untuk bereksperimen dengan Linear SVC untuk melihat bagaimana ia berfungsi.
Baris kedua mencipta contoh menggunakan variable svmClassifier. Ini adalah pembolehubah penting untuk diingati. Parameter random_state membolehkan anda menghasilkan semula contoh-contoh ini dan mendapatkan hasil yang sama. Jika anda tidak memasukkan parameter random_state, hasil anda mungkin berbeza daripada yang ditunjukkan di sini.