Paparan Topik | Hari Statistik

Peran Statistik pada Era Big Data

Peringatan Hari Statistik Nasional pada 26 September diharapkan akan meningkatkan kesadaran masyarakat mengenai pentingnya statistik, peningkatan penggunaan statistik, dan pengembangannya.

KOMPAS/Lasti Kurnia

Rapat pimpinan Badan Pusat Statistik (BPS) di Ruang Kendali Eksekutif, di Gedung 3, Badan Pusat Statistik, Jakarta, Minggu (16/2/2020). Lewat ruang kendali ini para pimpinan BPS melihat perkembangan pelaksanaan sensus penduduk 2020.

Fakta Singkat

  • Statistik dikenal sejak zaman sebelum masehi
  • Setiap tahapan dalam statistik harus dilakukan dengan benar, karena dapat berakibat pada kesimpulan atau rekomendasi yang salah.
  • Garbage in, Garbage out: jika data yang masuk tidak benar, maka hasil kesimpulannya nanti pun tidak akan benar.
  • Penerapan statistik tanpa mengetahui konsepnya dapat berakibat fatal
  • Teori Statistika tetap diperlukan pada era big data
  • 26 September diperingati sebagai Hari Statistik Nasional

Regulasi di Indonesia: 

Hari Statistik Nasional diperingati setiap tanggal 26 September. Momentum ditetapkannya Hari Statistik Nasional mengacu sejarah tanggal disahkannya Undang-Undang Nomor 7 Tahun 1960 tentang Statistik. UU tersebut disahkan pada 26 September 1960.

Dalam perkembangannya, untuk menyesuaikan dengan kebutuhan dan situasi bangsa yang makin kompleks dan makin maju, maka UU Nomor 7 Tahun 1960 tersebut diperbarui dengan UU No. 16 Tahun 1997 tentang Statistik.

Makna peringatan Hari Statistik Nasional, yakni untuk dapat meningkatkan kesadaran masyarakat mengenai pentingnya statistik; meningkatkan penggunaan statistik; mendorong para penggiat statistik untuk terus mengembangkannya; serta melakukan kegiatan statistik dengan kaidah, pedoman, dan aturan yang berlaku.

Bagi sebagian masyarakat, makna statistik masih belum diartikan secara tepat. Kebanyakan membayangkan “statistik” sebagai sekumpulan angka atau notasi atau simbol dalam rumus dengan istilah asing yang sulit dipahami maknanya. Sebagian lagi mengaitkannya dengan matematika, menganggapnya sama atau bagian dari disiplin ilmu matematika. Sebenarnya statistik dipelajari dalam Statistika, yang merupakan salah satu penerapan matematika.

KOMPAS/LASTI KURNIA

Suasana Sekretariat Sensus Penduduk 2020 di Badan Pusat Statistik (BPS), Jakarta, Minggu (16/2/2020). Badan Pusat Statistik (BPS) memulai sensus penduduk 2020 secara online dan offline. Sensus penduduk 2020 secara online mulai tanggal 15 Februari – 31 Maret 2020. Sementara sensus penduduk 2020 secara offline dilaksanakan 1 – 31 Juli 2020 oleh petugas sensus yang mendata langsung melalui wawancara terhadap penduduk.

Apa itu Statistik?

Definisi dari statistik adalah kumpulan data yang menggambarkan suatu keadaan. Jika mengacu pada UU Statistik No. 16 Tahun 1997 pada Bab I Pasal 1, yang dimaksud dengan statistik adalah data yang diperoleh dengan cara pengumpulan, pengolahan, penyajian, dan analisis serta sebagai sistem yang mengatur keterkaitan antar unsur dalam penyelenggaraan statistik.

Ilmu yang mempelajari statistik adalah Statistika. Jadi, Statistika adalah ilmu tentang bagaimana cara mengumpulkan data, mengolah data, menyajikan data, menganalisis dengan sejumlah instrumennya, hingga menghasilkan suatu kesimpulan, bahkan hingga rekomendasi berdasarkan hasil analisis dan kesimpulan tersebut.

Setiap pelaksanaan tahapan tersebut harus diperhatikan dan dilakukan dengan benar karena dalam tahap analisis, alat yang dapat digunakan tergantung dari data hasil di tahapan sebelumnya. Hal ini merupakan bagian terpenting dalam mempelajari ilmu ini. Kesalahan dalam menggunakan alat analisis akan berakibat pada kesimpulan dan bahkan rekomendasi yang salah, atau sering disebut sebagai “garbage in, garbage out”.

KOMPAS/AGUS SUSANTO

Petugas Sensus Penduduk 2020 berkeliling hunian untuk memverifikasi data di lapangan di RW 03 Kelurahan Galur, Kecamatan Johar Baru, Jakarta Pusat, Selasa (2/9/2020). Pencatatan ini dilakukan untuk menghasilkan satu data tunggal penduduk Indonesia, yang kelak akan menjadi dasar pembuatan keputusan dalam berbagai bidang. Mengacu kepada referensi Perserikatan Bangsa-Bangsa (PBB), setiap negara diminta melaksanakan sensus penduduk setidaknya sekali dalam sepuluh tahun.

Perkembangan Statistika dari masa ke masa

Perkembangan statistika terjadi sejak masa sebelum Masehi. Catatan tentang hal ditemukan dalam tulisan filsuf Yunani seperti Aristoteles dan Plato yang mengusulkan sistem pemilihan langsung terhadap pejabat publik. Pemilihan langsung ini kemudian dikenal sebagai demokrasi langsung. Pada saat itu, pejabat terpilih adalah calon yang paling banyak dipilih masyarakat.

Bangsa-bangsa di Mesopotamia, Mesir, dan Cina juga sudah menggunakan statistika untuk menghitung jumlah pajak yang harus dibayar penduduk dan jumlah hasil panen dari pertanian. Pelaksanaan tentang hal ini adalah ketika Kaisar Agustus meminta setiap orang untuk membayar pajak kepada statistikawan terdekat (pengumpul pajak). Pada abad pertengahan, statistika juga sudah digunakan oleh gereja dalam mencatat jumlah kelahiran, kematian, dan pernikahan.

Istilah “Statistika” sendiri berasal dari bahasa Latin modern, yaitu statisticum collegium, yang berarti “dewan negara”, dan dari bahasa Italia, yaitu statista, yang berarti “negarawan” atau “politikus”. Istilah ini pertama kali digunakan oleh Gottfried Achenwall pada tahun 1749, dalam tulisannya yang berjudul Staatsverfassung der heutigen vornehmsten Europäischen Reiche und Völker im Grundrisse (Konstitusi Negara Kerajaan dan bBngsa Eropa yang Paling Terkenal Saat Ini).

Di tulisan tersebut, kata “statistik” (dalam bahasa Jerman) digunakan untuk kegiatan analisis data kenegaraan. Ekonom Jerman memberinya julukan “Bapak Statistik”, tetapi penulis Inggris tidak setuju, karena di Inggris ada John Sinclair yang memperkenalkan istilah “Statistik” dalam bahasa Inggris untuk pertama kalinya. Dia menggunakan kata “statistik” dalam bukunya yang berjudul Statistical Account of Scotland pada tahun 1791.

Sebenarnya ada perbedaan makna antara istilah “statistika” yang digunakan oleh Gottfried Achenwall dan John Sinclair. Makna “statistika” menurut Gottfried lebih mengarah ke suatu metode dalam hal politik dan kenegaraan, sedangkan menurut John Sinclair, maknanya lebih ke arah metode pengumpulan data atau informasi dalam bentuk numerik lainnya.

Perkembangan analisis deskriptif, seperti tabel frekuensi, nilai rata-rata, dan ragam untuk sampel sudah mulai berkembang sejak tahun 1700-an. Namun, baru sekitar tahun 1800-an penyajian data dalam bentuk grafik, dan grafik-grafik sebaran data seperti histogram dan kurva normal mulai digunakan. Pelopor hal ini adalah seorang perawat bernama Florence Nightengale (1820–1910). Nightengale mengumpulkan data dan menyajikannya dalam bentuk grafik tentang hubungan perbaikan kondisi kesehatan dengan penurunan tingkat mortalitas.

Perkembangan statistika berikutnya terjadi pada paruh kedua abad ke-19 dan awal abad ke-20. Karl Pearson, seorang ahli fisika matematika, memperkenalkan metode regresi linear. Pearson melakukan penelitian statistika hampir setengah abad dan juga mendirikan jurnal Biometrika.

Jika Pearson hanya meneliti contoh besar, maka William Sealey Gosset, 1876–1937, murid Karl Pearson mengembangkan masalah sampel berukuran kecil. Sayangnya, penelitian Gosset masih terbatas pada penelitian berdasarkan kartu. Masalah mengacak (mengocok), mengambil sampel dan membuat sebaran frekuensi empiriknya dilakukan berdasarkan percobaan dengan kartu tersebut. Hasil penelitiannya itu diterbitkan dalam jurnal Biometrika pada tahun 1908. Dalam jurnal tersebut, Gosset menggunakan nama student, sehingga kemudian teorinya tersebut dikenal sebagai sebaran t-Student.

Selanjutnya ada Ronald Fisher, 1890–1962, yang dipengaruhi oleh Pearson dan Student, memperkenalkan analisis varians (ANOVA) dalam beberapa bukunya. Namun, yang membuat ANOVA ini semakin banyak dikenal adalah bukunya yang berjudul Statistical Methods for Research Workers (1925) dan The Design of Experiments (1935). Selain itu, Fisher dan beberapa muridnya juga banyak menggunakan prosedur-prosedur statistika dalam berbagai bidang, terutama dalam bidang-bidang pertanian, biologi, dan genetika.

Tokoh statistik lain adalah J. Neyman (1894) dan E. S. Pearson (1895, anak Karl Pearson), yang memperkenalkan teori pengujian hipotesis pada tahun 1936 dan 1938. Teori ini banyak menarik perhatian peneliti lain untuk dikembangkan lebih jauh karena kepraktisan penggunaannya. Pada tahun 1902–1950, ada tokoh statistik lain, yaitu Abraham Wald. Dia menulis dua buah buku, yaitu Sequential Analysis dan Statistical Decision Functions, yang sangat bermanfaat dalam perkembangan statistika hingga saat ini.

Penggunaan statistika pada masa sekarang dapat dikatakan telah menyentuh semua bidang ilmu pengetahuan, mulai dari astronomi, ekonomi, biologi dan cabang-cabang terapannya, serta psikologi. Hal itu menyebabkan lahirnya ilmu-ilmu gabungan seperti ekonometrika, biometrika atau biostatistika, dan psikometri.

Infografik: Sensus Penduduk 2020 (Badan Pusat Statistik)

Perkembangan Statistik pada era Big Data

Alat analisis dalam statistika sangat banyak, dan masing-masing mempunyai beberapa asumsi yang harus dipenuhi sebelum digunakan. Namun, tidak seperti ilmu pasti lainnya, statistika umumnya mengandung suatu tingkat kesalahan, yang harus dikelola dengan sangat cermat, agar tidak menimbulkan kesalahan penarikan kesimpulan atau prediksi.

Tingkat kesalahan yang paling umum digunakan adalah 5 persen, namun untuk kasus-kasus tertentu, tingkat kesalahan ini bisa dilonggarkan (misalnya menjadi 10 persen), atau pun diperketat (1%). Bahkan, untuk kasus yang sangat khusus (misal berhubungan dengan nyawa manusia), tingkat kesalahan bisa diperketat menjadi lebih kecil dari 1 persen.

Tentu penentuan tingkat kesalahan ini berefek pada jumlah sampel minimal yang harus dikumpulkan. Semakin kecil tingkat kesalahan yang dikehendaki, semakin besar sampel yang dibutuhkan. Permasalahannya, mengumpulkan jumlah sampel yang banyak juga bukan tanpa resiko. Ada masalah penentuan metode sampling yang tepat, cara pengambilan sampel, tingkat representatif, sampai kesalahan non-sampling, yang dapat membuat tingkat akurasi dari sampel besar tidak lebih baik dari sampel yang lebih kecil.

Di sinilah tugas seorang ahli statistik dalam mencari formula terbaik agar semua langkah-langkah dari pengumpulan sampel sampai dalam menganalisis data, serta menarik kesimpulan akhir, berjalan dengan baik dan sesuai kaidah-kaidah statistik yang benar. Kesalahan kecil di salah satu bagian saja, dapat meruntuhkan seluruh bangunan penelitian yang sudah dilakukan.

Ada pepatah yang mengatakan “Garbage in, Garbage out”, yang dapat diartikan menjadi: jika data yang masuk tidak benar, maka hasil kesimpulannya nanti pun tidak akan benar.

Selain itu, konsep dasar statistik harus diperhatikan dengan cermat. Penerapan statistik tanpa mengetahui konsepnya dapat berakibat fatal. Misalnya saja uji beda 2 sampel menggunakan t test dari 2 buah kelompok yang masing-masing beranggotakan 10 objek. Perbedaan rata-rata sebesar 0,1 poin akan dianggap tidak berbeda signifikan secara statistik, namun jika jumlah anggota kelompok sangat besar, misalnya ribuan, bahkan jutaan objek, perbedaan rata-rata sebesar 0,1 poin akan menjadi berbeda signifikan secara statistik. Inilah yang perlu diwaspadai dalam menerapkan uji statistik (konvensional) pada big data.

Hal lain misalnya, dalam melakukan alur penelitian statistik konvensional, biasanya peneliti akan merumuskan permasalahan terlebih dulu baru kemudian merancang sebuah metode pengambilan sampel dan mengujinya. Namun pada era big data, data tersebut sudah tersedia, sehingga yang perlu dilakukan tinggal menganalisis dan mengujinya saja. Hal yang perlu diwaspadai adalah kecenderungan data yang dimiliki tidak representatif, sehingga hasil analisis dan uji tidak dapat secara tepat menjawab permasalahan yang ada.

Masalah lain yang banyak terjadi saat ini adalah data yang banyak tersebar memiliki bentuk yang berbeda-beda dan tidak terstruktur. Hal ini membuat masalah pengumpulan data menjadi faktor yang krusial dalam kasus ini. Proses ini menjadi tantangan awal yang tidak mudah karena membutuhkan proses dan waktu yang cukup panjang agar data siap diolah.

Setelah tahapan itu terlewati, masih ada masalah dalam menentukan peubah (prediktor dan target) yang akan digunakan dalam analisis. Belum lagi, jika terdapat banyak missing data, maupun pencilan data. Semua ini perlu ditangani satu per satu dan perlu tindakan yang cermat dan tepat agar data tidak menjadi semakin rusak.

Dari beberapa contoh permasalahan di atas, perlu adanya modifikasi atau cara atau teknik baru agar statistik (konvensional) dapat diterapkan secara tepat. Masalah-masalah tersebut baru muncul pada era sekarang sehingga perlu pendekatan baru dalam mengatasinya.

Sebagai gambaran, teknik validasi pada data yang digunakan di big data. Teknik ini membagi data menjadi data latih dan data uji. Selain itu, teknik validasi juga menunjukkan bahwa konsep pengambilan sampel masih diperlukan pada era big data. Oleh karena itu, teori Statistika tetap diperlukan pada era big data, namun perlu beberapa penyesuaian agar kesalahan dari hasil analisis tetap bisa dijaga serendah mungkin.

KOMPAS/WAWAN H PRABOWO

Kepala Badan Pusat Statistik Suhariyanto memberikan sambutan dihadapan Presiden Joko Widodo pada Pencanangan Pelaksanaan Sensus Penduduk 2020 di Istana Negara, Jakarta, Jumat (24/1/2020). BPS menyelenggarakan sensus penduduk yang ketujuh pada 2020 ini dengan menggunakan metode kombinasi, menggabungkan pendataan mandiri secara daring pada 15 Februari – 30 Maret 2020 dan pendataan langsung oleh petugas yang mendatangi rumah warga pada Juli 2020.

Penerapan Statistik di Indonesia

Di Indonesia, salah satu badan milik pemerintah yang memiliki kewenangan atau otoritas mengumpulkan, mengolah, dan menyajikan data statistik adalah Badan Pusat Statistik (BPS).

Badan ini menyelenggarakan Sensus Penduduk dan sejumlah survei tematis yang datanya bisa digunakan oleh pemerintah, swasta, dan masyarakat luas untuk mengambil keputusan maupun sebagai sumber pengetahuan.

Menurut laman Badan Pusat Statistik, kegiatan statistik di Indonesia sudah dilaksanakan sejak masa Pemerintahan Hindia Belanda oleh suatu lembaga yang didirikan oleh Direktur Pertanian, Kerajinan, dan Perdagangan (Directeur Van Landbouw Nijverheld en Handel) di Bogor pada Februarl 1920.

Lembaga tersebut bertugas mengolah dan mempublikasikan data statistik. Pada 24 September 1924, kegiatan statistik pindah ke Jakarta dengan nama Centraal Kantoor Voor De Statistiek (CKS) dan melaksanakan Sensus Penduduk pertama di Indonesia pada tahun 1930.

Pada masa pemerintahan Jepang di Indonesia, 1942–1945, CKS berubah nama menjadi Shomubu Chosasitsu Gunseikanbu dengan kegiatan memenuhi kebutuhan perang/militer.

Setelah kemerdekaan Republik Indonesia diproklamasikan pada tanggal 17 Agustus 1945, lembaga tersebut dinasionalisasikan dengan nama Kantor Penyelidikan Perangkaan Umum Republik Indonesia (KAPPURI) dan dipimpin oleh Mr. Abdul Karim Pringgodigdo.

Setelah adanya Surat Edaran Kementerian Kemakmuran tanggal 12 Juni 1950 Nomor 219/S.C., lembaga KAPPURI dan CKS dilebur menjadi Kantor Pusat Statistik (KPS) di bawah tanggung jawab Menteri Kemakmuran.

Berdasarkan Surat Keputusan Menteri Perekonomian Nomor P/44, KPS bertanggungjawab kepada Menteri Perekonomian. Selanjutnya, melalui SK Menteri Perekonomian Tanggal 24 Desember 1953 Nomor IB.099/M kegiatan KPS dibagi dalam dua bagian, yaitu Afdeling A (Bagian Riset) dan Afdeling B (Bagian penyelenggaraan dan Tata Usaha). Berdasarkan Keppres X Nomor 172 tanggal 1 Juni 1957, KPS berubah menjadi Biro Pusat Statistik dan bertanggungjawab langsung kepada Perdana Menteri.

Sesuai dengan UU No.6/1960 tentang Sensus, BPS menyelenggarakan Sensus Penduduk serentak pada tahun 1961. Sensus Penduduk tersebut merupakan Sensus Penduduk pertama setelah Indonesia merdeka.

Sensus Penduduk di tingkat provinsi dilaksanakan oleh Kantor Gubernur dan di tingkat kabupaten/kota madya dilaksanakan oleh Kantor Bupati/Wali Kota, sedangkan pada tingkat kecamatan dibentuk bagian yang melaksanakan Sensus Penduduk.

Selanjutnya Penyelenggara Sensus di Kantor Gubernur dan Kantor Bupati/Wali Kota ditetapkan menjadi Kantor Sensus dan Statistik Daerah berdasarkan Keputusan Presidium Kabinet Nomor Aa/C/9 Tahun 1965.

Berdasarkan Peraturan Pemerintah No.16/1968 yang mengatur tentang Organisasi dan Tata Kerja BPS di Pusat dan Daerah serta perubahannya menjadi PP No.6/1980, disebutkan bahwa perwakilan BPS di daerah adalah Kantor Statistik Provinsi dan Kantor Statistik Kabupaten atau Kota.

Terkait organisasi BPS, ditetapkan kembali PP No. 2 Tahun 1992 yang disahkan pada 9 Januari 1992. Selanjutnya, kedudukan, fungsi, tugas, susunan organisasi, dan tata kerja BPS diatur dengan Keputusan Presiden Nomor 6 Tahun 1992.

Pada tanggal 19 Mei 1997 ditetapkan UU Nomor 16 Tahun 1997 tentang Statistik, di mana Biro Pusat Statistik diubah namanya menjadi “Badan Pusat Statistik”. Keputusan Presiden No. 86 Tahun 1998 tentang Badan Pusat Statistik, menetapkan bahwa perwakilan BPS di daerah merupakan Instansi Vertikal dengan nama BPS Provinsi, BPS Kabupaten, dan BPS Kotamadya. Serta pada tanggal 26 Mei 1999, ditetapkan PP Nomor 51 Tahun 1999 tentang Penyelenggaraan Statistik di Indonesia.

Kini, penerapan statistik tidak hanya dilakukan oleh lembaga pemerintah saja namun sudah sangat luas diterapkan lembaga konsultan maupun lembaga survei milik swasta. Di perguruan tinggi pun ilmu statistik banyak dikembangkan mulai dari jenjang politeknik maupun universitas.

Mengenali, mempelajari, dan menerapkan statistik pada dasarnya dilakukan oleh setiap manusia dalam aktivitasnya sehari-hari di berbagai bidang kehidupan. Statistik tidak hanya terkait dan berkutat dengan angka-angka dan hitung-hitungan semata. Namun, lebih dari itu. Manfaatnya jauh lebih besar, yakni bisa digunakan untuk merencanakan, memperhitungkan, dan memprediksi suatu fenomena kehidupan sehingga bisa menatap kehidupan menjadi lebih baik. (LITBANG KOMPAS)