Video: C# SQL Database Tutorial 1:How to Connect and Use Local Database ( sql server ) using C# 2024
Untuk menjalankan analisis ramalan, anda perlu mendapatkan data dalam bentuk yang boleh digunakan oleh algoritma untuk membina model. Untuk melakukan itu, anda perlu mengambil sedikit masa untuk memahami data dan mengetahui strukturnya. Ketik fungsi untuk mengetahui struktur data. Inilah yang sepertinya: >> str (biji) 'data. bingkai ': 210 obs. daripada 8 pembolehubah: $ V1: num 15. 3 14. 9 14. 3 13. 8 16. 1 … $ V2: num 14. 8 14. 6 14. 1 13. 9 15 … $ V3: num 0. 871 0 881 0 905 0. 895 0. 903 … $ V4: num 5. 76 5. 55 5. 29 5. 32 5. 66 … $ V5: num 3. 31 3. 33 3. 34 3. 38 3. 56 … $ V6: num 2. 22 1. 02 2. 7 2. 26 1. 35 … $ V7: num 5. 22 4. 96 4. 83 4. 8 5. 17 … $ V8: int 1 1 1 1 1 1 1 1 1 1 …
Dari melihat struktur, anda boleh memberitahu bahawa data memerlukan satu langkah pra-pemprosesan dan satu langkah mudah:
-
Ini tidak diperlukan, tetapi untuk tujuan contoh ini, lebih mudah untuk menggunakan nama lajur yang anda boleh faham dan ingat. Tukar atribut dengan nilai kategori kepada faktor.
-
Label mempunyai tiga kategori yang mungkin. c ("kawasan", "perimeter", "padat", "panjang", "lebar", " asimetri "," length2 "," seedType ")
Seterusnya, tukar atribut yang mempunyai nilai-nilai mutlak kepada faktor. Kod berikut mengubah jenis data kepada faktor:
>> benih $ seedType <- factor (benih $ seedType) Perintah ini selesai penyediaan data untuk proses pemodelan. Berikut adalah pandangan struktur selepas proses penyediaan data: data
str (rumpai) '. bingkai ': 210 obs. daripada 8 pembolehubah: kawasan $: num 15. 3 14. 9 14. 3 13. 8 16. 1 … $ perimeter: num 14. 8 14. 6 14. 1 13. 9 15 … $ padat: num 0. 871 0 881 0 905 0. 895 0. 903 … $ panjang: num 5. 76 5. 55 5. 29 5. 32 5. 66 … $ lebar: num 3. 31 3. 33 3. 34 3. 38 3. 56 … $ asimetri: num 2. 22 1. 02 2. 7 2. 26 1. 35 … $ length2: num 5. 22 4. 96 4. 83 4. 8 5. 17 … $ seedType: Factor w / 3 levels "1", "2", "3": 1 1 1 1 1 1 1 1 1 1 …