pengertian dataset

Apa itu Dataset? Berikut Pengertian, Contoh, serta Jenis-jenisnya!

Jika kamu sering mempelajari ilmu data, pasti kamu sering mendengar istilah dataset. Tapi, sebetulnya apa itu dataset?

Nah, di artikel ini kita akan membahasnya secara lengkap. Materi ini penting, karena dengan memahami dataset, kamu akan lebih paham tentang esensi data yang kamu olah.

Tanpa perlu berlama-lama, berikut penjelasan lengkapnya!

Apa itu Dataset?

Dataset adalah sekumpulan data yang disusun secara terstruktur. Biasanya, dataset dipresentasikan dalam bentuk tabel, alias baris dan kolom.

Tiap baris dan kolom biasanya mewakili variabel tertentu. Contohnya, misalkan suatu kolom mewakili jumlah skor siswa, sedangkan barisnya mewakili kelas siswanya.

Dengan kata lain, salah satu fungsi dataset adalah untuk memperhatikan hubungan antar variabel. Khususnya jika jumlah data dan variabel yang diteliti cukup bervariasi.

memahami apa itu dataset melalui ilustrasi data di google analytics

Di tahap ini mungkin kamu masih penasaran. Kira-kira apa sih bedanya dataset dengan data dan database? Yuk kita lihat jawabannya di bagian selanjutnya!

Baca juga: Apa Pentingnya Data dan Informasi bagi Bisnis?

Apa Perbedaan Dataset dengan Data dan Database?

Di atas, kamu sudah tahu bahwa dataset adalah sekumpulan data yang disusun secara terstruktur. Bagaimana dengan data dan database? Berikut pengertiannya:

  • Data – Data adalah sekeping fakta atau informasi yang menampilkan nilai tertentu. Contohnya seperti angka berat badan atau jumlah siswa.
  • Database –  Database adalah tempat di mana kumpulan data disimpan. Jika data adalah baju, maka database adalah lemarinya.

Nah, sudah jelas kan perbedaan antara data, dataset, dan database? Ketiganya punya peran yang berbeda. Walau begitu, apa hubungan di antara ketiganya?

Sederhananya begini. Misalkan kamu sedang mengumpulkan data nilai siswa dengan menggunakan Excel

logo microsoft excel

Setiap nilai siswa yang kamu masukkan ke Excel adalah data. Lalu, tabel yang kamu buat di Excel adalah dataset. Sedangkan Excel adalah database-nya, karena di sanalah kamu menyimpan, mengolah, dan mengelola datanya.

Jadi, satu database bisa berisi banyak dataset, dan satu dataset bisa berisi banyak data.

Baca juga: 13+ Jenis Database yang Wajib Kamu Ketahui

Apa Saja Jenis-jenis Dataset?

Setelah memahami pengertian dan fungsi dataset, sekarang kamu perlu mengetahui berbagai jenis dataset yang ada di luar sana.

Berikut adalah beberapa jenis dataset yang paling umum digunakan, yaitu:

  1. Numerical dataset
  2. Correlation dataset
  3. Categorical dataset
  4. Bivariate dataset
  5. Multivariate dataset

Mari kita bahas satu per satu!

1. Numerical Dataset

Numerical dataset adalah jenis dataset yang paling sederhana. Karena, isinya hanyalah data yang berupa angka. Itulah mengapa jenis dataset ini juga kerap disebut data kuantitatif.

Contohnya, jika kamu sedang mengumpulkan data berat badan dari sekumpulan orang, berarti kamu sedang membuat numerical dataset. Karena data yang kamu kumpulkan hanya berisi angka.

2. Correlation Dataset

Sesuai dengan namanya, correlation dataset adalah jenis dataset yang berisi data yang memiliki korelasi, atau saling terhubung satu sama lain.

Contohnya, misalkan kamu sedang mengumpulkan data penjualan di suatu toko. Lalu, kamu menemukan bahwa ketika penjualan sikat gigi meningkat, penjualan pasta gigi juga ikut meningkat.

Nah, kumpulan data penjualan sikat gigi dan pasta gigi bisa diklasifikasikan ke dalam correlation dataset, karena keduanya saling berhubungan.

Oh ya, korelasi yang dihasilkan dari dataset ini juga bisa dibagi ke dalam tiga jenis, yaitu:

  • No correlation – Data yang dikumpulkan tidak ada hubungannya sama sekali.
  • Positive correlation – Data yang dikumpulkan punya pengaruh yang sama. Contohnya seperti data penjualan sikat gigi dan pasta gigi yang sama-sama meningkat.
  • Negative correlation – Data yang dikumpulkan punya pengaruh yang berlawanan. Contohnya, misalkan penjualan jus menurun jika penjualan susu meningkat.

3. Categorical Dataset

Categorical dataset adalah jenis dataset yang biasanya digunakan untuk membagi sekumpulan data ke dalam dua kategori yang berbeda. 

Contoh paling gampangnya adalah gender (Laki-laki atau perempuan). Atau data yang merupakan jawaban dari pertanyaan yang bisa direspon dengan setuju atau tidak setuju.

4. Bivariate Dataset

Bivariate artinya adalah dua variabel. Jadi, jenis dataset ini menggambarkan hubungan antara dua variabel saja.

Contohnya, misalkan kamu ingin menentukan bonus untuk masing-masing anggota tim sales. Jadi, bonus yang diberikan akan dihitung berdasarkan dua variabel berikut:

  • Jumlah produk yang dijual
  • Jumlah keuntungan yang diraih per bulannya

Nah, karena kedua data tersebut saling berhubungan, maka kumpulan data tersebut masuk ke dalam kategori bivariate dataset.

5. Multivariate Dataset

Jika bivariate dataset hanya mengandung dua variabel, multivariate adalah dataset yang mengandung lebih dari dua variabel.

Contohnya, misalkan kamu sedang mengumpulkan data terkait karyawan. Jadi, kamu menyimpan data terkait umur, alamat, nomor telepon, dan alamat email.

Berhubung dataset yang kamu buat berisi empat variabel yang berbeda, berarti dataset yang kamu buat bertipe multivariate.

Baca juga: Big Data dan Perannya Membentuk LinkedIn yang Sekarang

Yuk Pelajari Dataset secara Lebih Mendalam!

Sekarang kamu sudah mempelajari wawasan dasar terkait dataset. Mulai dari pengertian dataset, perbedaannya dengan data dan database, hingga jenis-jenisnya.

Intinya, dengan memahami dataset, kamu akan lebih paham bagaimana peran data di dalam database, jenis data, serta hubungan antar variabel yang sedang kamu olah.

Nah, dataset merupakan salah satu bagian dari ilmu data. Jika kamu ingin menguasai ilmu data lebih dalam, kamu bisa join Komunitas Data Science Bitlabs Academy di Discord!

Yuk klik banner di bawah ini untuk join grupnya:

banner discord data science bitlabs

Comments

Leave a Reply

Your email address will not be published.

Loading…

0
rumus vlookup excel

Apa Itu Rumus VLOOKUP? Ini Cara Menggunakannya di Excel!

pengolahan data

Apa itu Pengolahan Data? Berikut Pengertian serta Manfaatnya!