Data adalah kumpulan nilai dari suatu obyek. Data mentah diambil dari sampel atau populasi. Jenis data menurut cara memperolehnya dibagi menjadi data primer dan data sekunder. Data primer adalah secara langsung diambil dari objek / obyek penelitian Data sekunder adalah data yang didapat tidak secara langsung dari objek penelitian. Peneliti mendapatkan data yang sudah jadi yang dikumpulkan oleh pihak lain dengan berbagai cara atau metode.
A. Pengelompokan Data yang Telah Terkumpul
Data yang telah terkumpul segera dikelompokkan untuk dapat mempermudah pengolahan data. Perlu dibedakan data kualitatif, data kuantitatif, data pribadi, data primer, data sekunder, data tertulis, data lisan, dan data relevan.
1. Pengelompokan Data Dengan Statistik
Statistik adalah kumpulan dari cara dan aturan mengenai pengumpulan, pengolahan, penafsiran, dan penarikan simpulan dari data yang berupa angka. Statistik dibedakan dua macam, yaitu statistik deskriptif dan statistik induktif
Dalam surat kabar atau majalah sering dijumpai angka statistik. Angka statistik berguna untuk bahan keterangan bagi orang atau badan yang memerlukannya. Contoh :
Ciri-ciri statistik ada tiga macam, yaitu:
1) bekerja dan mengolah data yang bersifat umum,
2) bekerja dengan menggunakan angka, dan
3) bekerja secara objektif.
B. Mengenali Kecenderungan Umum Data Dengan Bantuan Statistik Sederhana
a. Distribusi Frekuensi
Dalam penelitian yang menggunakan sampel random, peneliti telah mengumpulkan data umur akspetor KB di daerah A sebagai berikut. 35, 32, 17, 30, 37, 20, 24, 43, 30, 21, 45, 25, 37, 23, 35, 35, 30, 21, 35, 23, 24, 30, 20, 30, 25, 24, 24, 40, 35, 37, 37, 40, 35, 40
Dari nilai tersebut disusun secara teratur mulai dari umur termuda sampai tertua. Setelah diurutkan, diketahui jumlah akseptor untuk umur itu. Kumpulan pasangan nilai dengan frekuensinya disebut distribusi frekuensi, di mana X menyatakan umur yang dicapai dan f(X) menyatakan frekuensi pada umur itu.
Panjang interval yang memperlihatkan batas bawah dan batas atas nilai pengamatan disebut range. Nilai dalam pengamatan sampel tidak ditemukan di luar batas-batas ini. Besarnya range adalah selisih antara nilai terbesar dengan nilai yang terkecil. Dari data akseptor KB daerah A tersebut, range dari sampel dimulai dari nilai 17 dan berakhir pada nilai 45. Jadi, besarnya range = 45 - 17 = 28. Untuk lebih jelasnya lihat tabel berikut.
Dari data tersebut dapat dikelompokkan dengan interval 15 - 19, 20 - 24, 25 - 29, 30 - 34, 35 - 39, 40 - 44, 45 - 49 sehingga distribusi frekuensinya terlihat seperti tabel berikut.
Tabel 2.
Distribusi Frekuensi Dari Sampel Akseptor KB Daerah A
Cara perhitungan, titik tengah interval golongan tersebut dipakai sebagai nilai X dari golongan. Pada tabel di atas, titik tengah golongan adalah 17,5; 22,5; 27,5; 32,5; 37,5; 42,5; dan 47,5 dengan frekuensi masing-masing 1, 10, 2, 6, 10, 4, dan 1. Frekuensi tersebut untuk mempermudah perhitungan dan dianggap terjadi pada titik tengah tiap-tiap golongan. Kalau dibuat diagram dapat memudahkan dalam melihat perbandingan frekuensi dari berbagai kelas atau kategori.
Histogram merupakan gambaran diagram berbentuk balok atau petak. Lebar balok menunjukkan panjang interval kelas, kelompok atau satuan, sedangkan luas balok menunjukkan frekuensi kelompok. Dengan bentuk itu mudah dibandingkan frekuensi dari kelompok yang satu dan kelompok yang lain. Jika titik tengah dari garis atas balok dihubungkan antara yang satu dengan lainnya, diagram yang didapat merupakan suatu poligon. Contoh penyajian diagram histogram dan poligon distribusi frekuensi dari Tabel 2.
Contoh penyajian diagram lingkaran dengan persen dari Tabel 2. Suatu lingkaran dibagi menjadi bagian-bagian dan luas setiap bagian adalah frekuensi relatif kelas yang dinyatakan dalam persen.
15 - 19 = 2,9%
20 - 24 = 29,4%
25 - 29 = 5,9%
30 - 34 = 17,6%
35 - 39 = 29,4%
40 - 44 = 11,8%
45 - 49 = 2,9%
b. Ukuran Tendensi Sentral
Ukuran tendensi sentral merupakan indeks rata-rata dari distribusi nilai. Ada tiga macam ukuran tendensi sentral yang sering digunakan, yaitu modus (mode), median, dan mean (nilai rata-rata hitung).
Tabel 3.
Wanita yang Pernah Kawin dan Mengikuti KB
Menurut Anak yang Dilahirkan di Daerah A
1) Modus Atau Mode (Mo)
Modus adalah nilai yang paling besar frekuensinya. Pada Tabel 3, Mo sama dengan 2. Artinya, dari wanita yang pernah kawin dan pernah menggunakan cara kontrasepsi, frekuensi yang terbesar (630) adalah untuk yang pernah melahirkan 2 anak.
Distribusi frekuensi dalam statistik mempunyai lebih dari satu mode. Misalnya, jika dua nilai dari X mempunyai frekuensi yang sama dan frekuensi ini adalah yang terbanyak maka dikatakan bahwa distribusi frekuensinya adalah bimodal. Frekuensi yang semua nilainya sama maka semua nilai adalah mode. Distribusi frekuensi semacam ini disebut uniform.
Dari Tabel 2 juga bimodal, kedua mode adalah 22,5 dan 37,5 (titik-titik tengah dari kelompok umur 20 - 24 dan 35 - 39.
2) Median (Md)
Median adalah nilai yang merupakan pertengahan dari distribusi frekuensi. Artinya, 50% dari frekuensi terjadi pada nilai kurang atau sama dengan Md dan 50% lagi terjadi pada nilai lebih besar atau sama dengan Md. Pada Tabel 3, Md = 3, ini dapat dilihat pada kolom ketiga yang memperlihatkan frekuensi kumulatif. Karena 50% dari sejumlah sampel 3134 ternyata sebanyak 1756 wanita telah melahirkan anak hidup kurang atau sama dengan 3 orang.
Median untuk data Tabel 2 adalah 32,5 (titik tengah kelompok umur 30 - 34). Karena 50% dari sampel adalah 17, sedangkan 19 akseptor berumur kurang dari atau sama dengan 32,5 tahun dan 21 akseptor berumur lebih dari atau sama dengan 32,5 tahun. Kalau besarnya sampel (n) ganjil maka:
3) Nilai Rata-rata Atau Mean
Nilai rata-rata (mean) adalah jumlah semua nilai yang terjadi dalam distribusi dibagi atas jumlah pengamatan. Sebelum dihitung, nilai rata-rata data pada Tabel 3, kita perhatikan dulu nilai anak yang dilahirkan hidup. Untuk mempermudah perhitungan pada Tabel 3, kita temukan bahwa 9+ adalah 9. Penentuan ini tergantung kepada kebijaksanaan peneliti
C. Menggambarkan Hubungan Antara Berbagai Data
Dalam penyelidikan, banyak terjadi hubungan atau kaitan antara berbagai data di lapangan. Contoh:
baik, sedang, golongan pendapatan tinggi, golongan pendapatan menengah, golongan pendapatan rendah. Sebagai pasangannya, dinamakan data kuantitatif, yaitu segala data yang dapat dinyatakan dengan angka, apabila hendak diselidiki hubungan antara data kualitatif, dapat dipergunakan analisis korelasi. Akan tetapi, dengan data kualitatif analisis tidak dapat dipergunakan.
A. Pengelompokan Data yang Telah Terkumpul
Data yang telah terkumpul segera dikelompokkan untuk dapat mempermudah pengolahan data. Perlu dibedakan data kualitatif, data kuantitatif, data pribadi, data primer, data sekunder, data tertulis, data lisan, dan data relevan.
1. Pengelompokan Data Dengan Statistik
Statistik adalah kumpulan dari cara dan aturan mengenai pengumpulan, pengolahan, penafsiran, dan penarikan simpulan dari data yang berupa angka. Statistik dibedakan dua macam, yaitu statistik deskriptif dan statistik induktif
- Statistik Deskriptif. Statistik deskriptif ialah statistik yang membicarakan tentang penyusunan data dalam daftar dan pembuatan grafik yang tidak menyangkut penarikan simpulan. Pengolahan yang bersifat analisis dan interpretasi data termasuk dalam statistik deskriptif selama tidak menyangkut penarikan simpulan yang berlaku umum atau pembuatan generalisasi.
- Statistik Induktif. Statistik induktif ialah bagian statistik mengenai semua aturan dan cara yang dapat dipakai sebagai alat dalam mencoba menarik simpulan yang berlaku umum dari data yang tersusun dan diolah sebelumnya. Dalam statistik induktif, peneliti mencari keterangan yang berlaku umum, yaitu membuat generalisasi dari data yang sedang dihadapi dan sengaja dikumpulkan untuk tujuan itu.
Dalam surat kabar atau majalah sering dijumpai angka statistik. Angka statistik berguna untuk bahan keterangan bagi orang atau badan yang memerlukannya. Contoh :
- Kepolisian mencatat angka kejahatan dan pelanggaran lalu lintas agar usaha untuk menguranginya dapat direncanakan dan dilaksanakan lebih efektif dan lancar.
- Pemerintah pusat dan daerah memerlukan data penduduk daerah dan penduduk nasional dengan tujuan untuk memudahkan pembuatan rencana perekonomian dan pembangunan. Sebagian dari data itu dipakai untuk menilai hasil yang dicapai dengan memakai rencana masa lampau dan sebagian diperlukan untuk membuat rencana untuk masa yang akan datang.
- Departemen Pendidikan Nasional haruslah dapat menaksir jumlah penduduk Indonesia di tahun yang akan datang atau memperkirakan jumlah anak yang harus memasuki sekolah pada tahun itu, membuat rencana yang lebih sempurna mengenai jumlah ruangan sekolah yang harus dibangun, dan berapa banyak tambahan tenaga guru yang diperlukan.
Ciri-ciri statistik ada tiga macam, yaitu:
1) bekerja dan mengolah data yang bersifat umum,
2) bekerja dengan menggunakan angka, dan
3) bekerja secara objektif.
B. Mengenali Kecenderungan Umum Data Dengan Bantuan Statistik Sederhana
a. Distribusi Frekuensi
Dalam penelitian yang menggunakan sampel random, peneliti telah mengumpulkan data umur akspetor KB di daerah A sebagai berikut. 35, 32, 17, 30, 37, 20, 24, 43, 30, 21, 45, 25, 37, 23, 35, 35, 30, 21, 35, 23, 24, 30, 20, 30, 25, 24, 24, 40, 35, 37, 37, 40, 35, 40
Dari nilai tersebut disusun secara teratur mulai dari umur termuda sampai tertua. Setelah diurutkan, diketahui jumlah akseptor untuk umur itu. Kumpulan pasangan nilai dengan frekuensinya disebut distribusi frekuensi, di mana X menyatakan umur yang dicapai dan f(X) menyatakan frekuensi pada umur itu.
Panjang interval yang memperlihatkan batas bawah dan batas atas nilai pengamatan disebut range. Nilai dalam pengamatan sampel tidak ditemukan di luar batas-batas ini. Besarnya range adalah selisih antara nilai terbesar dengan nilai yang terkecil. Dari data akseptor KB daerah A tersebut, range dari sampel dimulai dari nilai 17 dan berakhir pada nilai 45. Jadi, besarnya range = 45 - 17 = 28. Untuk lebih jelasnya lihat tabel berikut.
Umur x | Turus | Frekuensi |
---|---|---|
17 | I | 1 |
20 | II | 2 |
21 | II | 2 |
23 | II | 2 |
24 | IIII | 4 |
25 | II | 2 |
30 | 5 | |
32 | I | 1 |
35 | 6 | |
37 | IIII | 4 |
40 | III | 3 |
43 | I | 1 |
45 | I | 1 |
Jumlah | - | 34 |
Tabel 2.
Distribusi Frekuensi Dari Sampel Akseptor KB Daerah A
Umur x | f (Kelas Umur) |
---|---|
15-19 | 1 |
20-24 | 10 |
25-29 | 2 |
30-34 | 6 |
35-39 | 10 |
40-44 | 4 |
45-49 | 1 |
Jumlah | 34 |
Histogram merupakan gambaran diagram berbentuk balok atau petak. Lebar balok menunjukkan panjang interval kelas, kelompok atau satuan, sedangkan luas balok menunjukkan frekuensi kelompok. Dengan bentuk itu mudah dibandingkan frekuensi dari kelompok yang satu dan kelompok yang lain. Jika titik tengah dari garis atas balok dihubungkan antara yang satu dengan lainnya, diagram yang didapat merupakan suatu poligon. Contoh penyajian diagram histogram dan poligon distribusi frekuensi dari Tabel 2.
Contoh penyajian diagram lingkaran dengan persen dari Tabel 2. Suatu lingkaran dibagi menjadi bagian-bagian dan luas setiap bagian adalah frekuensi relatif kelas yang dinyatakan dalam persen.
15 - 19 = 2,9%
20 - 24 = 29,4%
25 - 29 = 5,9%
30 - 34 = 17,6%
35 - 39 = 29,4%
40 - 44 = 11,8%
45 - 49 = 2,9%
b. Ukuran Tendensi Sentral
Ukuran tendensi sentral merupakan indeks rata-rata dari distribusi nilai. Ada tiga macam ukuran tendensi sentral yang sering digunakan, yaitu modus (mode), median, dan mean (nilai rata-rata hitung).
Tabel 3.
Wanita yang Pernah Kawin dan Mengikuti KB
Menurut Anak yang Dilahirkan di Daerah A
Jumlah Anak (Xi) | Jumlah Wanita f(Xi) | Jumlah Kumulatif Wanita F(Xi) |
---|---|---|
0 | 78 | 78 |
1 | 465 | 543 |
2 | 630 | 1.173 |
3 | 583 | 1.756 |
4 | 453 | 2.209 |
5 | 348 | 2.257 |
6 | 262 | 2.819 |
7 | 158 | 2.977 |
8 | 88 | 3.065 |
9+ | 69 | 3.134 |
Jumlah | 3.134 | - |
Modus adalah nilai yang paling besar frekuensinya. Pada Tabel 3, Mo sama dengan 2. Artinya, dari wanita yang pernah kawin dan pernah menggunakan cara kontrasepsi, frekuensi yang terbesar (630) adalah untuk yang pernah melahirkan 2 anak.
Distribusi frekuensi dalam statistik mempunyai lebih dari satu mode. Misalnya, jika dua nilai dari X mempunyai frekuensi yang sama dan frekuensi ini adalah yang terbanyak maka dikatakan bahwa distribusi frekuensinya adalah bimodal. Frekuensi yang semua nilainya sama maka semua nilai adalah mode. Distribusi frekuensi semacam ini disebut uniform.
Dari Tabel 2 juga bimodal, kedua mode adalah 22,5 dan 37,5 (titik-titik tengah dari kelompok umur 20 - 24 dan 35 - 39.
2) Median (Md)
Median adalah nilai yang merupakan pertengahan dari distribusi frekuensi. Artinya, 50% dari frekuensi terjadi pada nilai kurang atau sama dengan Md dan 50% lagi terjadi pada nilai lebih besar atau sama dengan Md. Pada Tabel 3, Md = 3, ini dapat dilihat pada kolom ketiga yang memperlihatkan frekuensi kumulatif. Karena 50% dari sejumlah sampel 3134 ternyata sebanyak 1756 wanita telah melahirkan anak hidup kurang atau sama dengan 3 orang.
Median untuk data Tabel 2 adalah 32,5 (titik tengah kelompok umur 30 - 34). Karena 50% dari sampel adalah 17, sedangkan 19 akseptor berumur kurang dari atau sama dengan 32,5 tahun dan 21 akseptor berumur lebih dari atau sama dengan 32,5 tahun. Kalau besarnya sampel (n) ganjil maka:
3) Nilai Rata-rata Atau Mean
Nilai rata-rata (mean) adalah jumlah semua nilai yang terjadi dalam distribusi dibagi atas jumlah pengamatan. Sebelum dihitung, nilai rata-rata data pada Tabel 3, kita perhatikan dulu nilai anak yang dilahirkan hidup. Untuk mempermudah perhitungan pada Tabel 3, kita temukan bahwa 9+ adalah 9. Penentuan ini tergantung kepada kebijaksanaan peneliti
C. Menggambarkan Hubungan Antara Berbagai Data
Dalam penyelidikan, banyak terjadi hubungan atau kaitan antara berbagai data di lapangan. Contoh:
- Daerah Kota yang Memiliki Banyak Industri dan Kota yang Tidak Memiliki Industri. Daerah kota yang memiliki banyak industri, angka urbanisasi lebih tinggi. Daerah kota yang tidak memiliki industri, angka urbanisasi lebih kecil.
- Daerah yang Subur dan Tandus. Daerah yang subur, jumlah penduduk cukup banyak, kepadatan lebih tinggi, dan penghasilan penduduk lebih tinggi dibanding daerah yang tandus. Daerah yang tandus, jumlah penduduk relatif sedikit, kepadatan penduduk rendah dan penghasilan penduduk lebih rendah dibanding daerah yang subur.
- Daerah yang Curah Hujannya Tinggi dan Curah Hujannya Rendah Daerah yang curah hujannya tinggi, produksi pertanian beraneka ragam dan lebih banyak. Daerah yang kering (curah hujan rendah) produksi pertanian homogen dan lebih sedikit.
baik, sedang, golongan pendapatan tinggi, golongan pendapatan menengah, golongan pendapatan rendah. Sebagai pasangannya, dinamakan data kuantitatif, yaitu segala data yang dapat dinyatakan dengan angka, apabila hendak diselidiki hubungan antara data kualitatif, dapat dipergunakan analisis korelasi. Akan tetapi, dengan data kualitatif analisis tidak dapat dipergunakan.