Ada banyak kasus kekerasan terhadap perempuan di Sumatera Barat. Pada 2014 misalnya terjadi 614 kasus kekerasan fisik, 21 kekerasan psikis, dan 107 kekerasan seksual. Selain itu, ada 48 kasus penelantaran dan 16 kasus Tindak Pidana Perdagangan Orang (TPPO). Kabupaten Pasaman menjadi wilayah dengan kasus kekerasan seksual tertinggi dengan 40 kasus.
Sederet fakta itu terlihat dari hasil analisis sederhana atas sumber data terbuka yang bisa dimanfaatkan oleh jurnalis dan entitas lainnya. Selama ini, ketersediaan data seolah menjadi salah satu masalah saat menyusun laporan atau pemberitaan mengenai kasus kekerasan terhadap perempuan. Padahal, data yang baik bisa menjadi bahan acuan kebijakan yang diambil dalam rangka mengarusutamakan isu pemberdayaan dan perlindungan perempuan di suatu daerah.
Sebetulnya, ada sejumlah platform menyajikan data mengenai isu kekerasan terhadap perempuan mulai dari civil society organization (CSO) maupun badan pemerintah. Namun, data ini kadang tersedia dalam bentuk grafis, persentase, dan olahan lain yang tidak memungkinkan dilakukan analisis lebih lanjut dengan metode yang berbeda.
Meski demikian, ada dataset yang bisa diunduh untuk diolah lebih lanjut seperti yang tersaji dalam laman resmi milik Dinas Pemberdayaan Perempuan dan Perlindungan Anak (DPPA) Sumatera Barat (Sumbar). Data ini bisa diakses melalui tautan ini. Saat dibuka kali pertama, tampilan laman akan terlihat seperti gambar di bawah ini.
Gambar 1. Tampilan laman https://dpppa.sumbarprov.go.id/
Untuk mendapatkan dataset mengenai jumlah kasus kekerasan seksual di Sumatera Barat, lalu meng-klik menu “PPID” pada header laman. Hasilnya, akan terlihat tampilan menu dropdown berisi “Profil PPID”, “Visi misi PPID”, hingga paling bawah “Informasi Serta Merta”. Di menu dropdown ini, klik “Informasi Secara Berkala.”
Gambar 2. Tampilan menu dropdown PPID laman DPPPA Sumbar.
Kemudian, pengunjung akan diperlihatkan tampilan berupa tabel berisi daftar dataset yang ada diikuti tahun dan tautan download. Untuk memudahkan pencarian dataset, gunakan menu “Search” di bagian atas tabel dan isi dengan kata kunci “data kekerasan” tanpa tanda kutip. Tampilannya terlihat seperti gambar berikut ini.
Gambar 3. Tampilan tautan dataset milik DPPPA Sumbar.
Kemudian, terlihat nama dokumen yang difilter oleh kata kunci. Lalu, klik tautan “download” pada nama dokumen Data Kekerasan Terhadap Perempuan dan Anak Tahun 2014. Kemudian, browser akan mengunduh dalam dalam bentuk PDF. File ini berisi dataset tentang nama kabupaten/kota, jenis kekerasan, subjek perempuan dan anak hingga jumlah kasus.
Gambar 4. Tampilan tabel data kekerasan terhadap perempuan di Sumbar tahun 2014.
Gambar 5. Tampilan tabel data kekerasan terhadap perempuan di Sumbar tahun 2015.
Agar dataset ini bisa diolah, file PDF ini harus diubah ke dalam bentuk Spreadsheet atau Excel. Ada beberapa perangkat yang bisa dipakai untuk mengubah tabel dalam bentuk PDF menjadi Spreadsheet salah satunya Tabula.
Tabula bisa diunduh melalui laman berikut. Perangkat ini dipakai di laptop atau komputer dengan OS Windows maupun Mac.
Gambar 6. Tangkapan layar perangkat Tabula dari laman resminya.
Di laman tersebut, klik jenis OS yang dipakai lalu klik versi perangkat sesuai spesifikasi laptop atau komputer. Aplikasi laptop memakai Windows 32 bit, pilihlah versi yang 32 bit. Hal serupa juga untuk Windows 64 bit, pilihlah versi perangkat dengan 64 bit.
Meski sudah diinstal, Tabula tidak akan bekerja sebelum menginstall juga Java. Tabula akan merekomendasikan secara otomatis apabila Java belum tersedia di laptop atau komputer.
Gambar 7. Tangkapan layar Java untuk mendukung kerja Tabula.
Seusai menginstall Java, aplikasi Tabula siap dipakai. Double klik pada icon Tabula di mana dia terpasang. Perintah ini akan memunculkan jendela Command berlatar hitam. Biarkan saja tampilan ini dan jangan ditutup. Jendela Command ini terlihat sebagai berikut.
Gambar 8. Tangkapan layar jendela Command saat memulai Tabula.
Setelah beberapa saat Tabula siap digunakan. Hal ini ditandai dengan membukanya tab browser baru. Tampilan Tabula ini terlihat di gambar 9.
Gambar 9. Tangkapan layar Tabula siap digunakan.
Setelah membuka Tabula, pilih file PDF yang ingin diekstrak. Caranya, dengan mengklik “browse” lalu arahkan jendela baru ke lokasi di mana file PDF tersimpan di hard drive laptop atau komputer. Setelah itu, klik “import” pada ujung isian.
Gambar 10. Tangkapan layar mengeblok tabel yang akan diekstrak oleh Tabula.
Kemudian, Tabula akan memperlihatkan isi file PDF. Arahkan dengan scroll ke atas atau ke bawah untuk menjadi tabel yang akan diekstrak. Apabila ketemu, sorot atau blok tabel yang akan diekstrak. Wilayah yang diekstrak akan ditandai dengan blok warna merah seperti pada gambar 10.
Gambar 11. Tangkapan layar preview tabel oleh Tabula.
Setelah diblok, klik pada “Preview & Export Extracted Data” pada tombol di pojok kanan atas. Tombol ini berwarna hijau sehingga cukup terlihat dengan jelas.
Tabula akan membuka tampilan tabel tadi menjadi tabel dinamis. Ada beberapa jenis file yang bisa dipilih sebelum mengunduh. Pada “Export Format” pilih CSV. Lalu, klik “Export”. Browser akan mengunduh sebuah file CSV. Buka di folder “Download”.
Gambar 12. Tangkapan layar data hasil unduhan dari Tabula.
Setelah diunduh, import file CSV tadi ke sebuah worksheet Spreadsheet. Caranya buka worksheet spreadsheet baru. Lalu, klik “File”. Lalu, klik “Import”. Arahkan file yang akan diimpor dari hard drive komputer atau laptop.
Data yang di-export dari Tabula biasanya tidak sesempurna file asli yang terlihat dalam bentuk PDF. Hal ini seperti yang terlihat pada gambar 12. Maka itu, perlu dibersihkan terlebih dahulu agar formatnya seragam dan datanya identik dengan file asli.
Langkah pertama yang perlu dilakukan yakni, merapikan data tersebut dengan menghapus nomor kolom. Kemudian, mengubah tanda “-” menjadi “0”. Spreadsheet dalam gambar di atas, tanda “-” diartikan sebagai string atau huruf. Artinya, ia tidak bisa dilakukan analisis seperti layaknya bilangan atau numerik.
Untuk mengubahnya, klik “Edit” pada toolbar Spreadsheet. Lalu, pilih “Cari dan Ganti”. Fungsi ini bisa juga dipanggil menggunakan shortcut kombinasi tombol “Ctrl” dan “H” atau “Ctrl + H”.
Masukkan angka atau huruf yang ingin diganti, yakni tanda “-” pada kolom “Cari”. Lalu, ketik angka 0 pada kolom “Ganti dengan”. Lalu, klik “Ganti Semua”. Tampilan ini terlihat pada gambar 13.
Gambar 13. Tangkapan layar fungsi “Find dan Replace” pada Spreadsheet.
Fungsi “Find and Replace” atau “Cari dan Ganti” mempermudah untuk mengubah data yang nilainya sama secara serentak. Namun, perhatikan juga apakah ada karakter yang akan diganti beririsan dengan kata atau variabel lain yang tidak ingin diganti. Jika ada, fungsi ini harus digunakan secara lebih cermat lagi.
Gambar 14. Tampilan tabel setelah dibersihkan.
Setelah diganti, tampilan isian akan terlihat seperti pada gambar 14. Tanda “-” berubah menjadi “0”. Untuk memastikan data yang dibersihkan identik dengan file asli, lakukan cek ulang sampai betul-betul fixed!
Data yang diperoleh ini sudah bersih. Namun, data belum siap diolah karena masih ada beberapa variabel yang tidak berada pada satu kolom yang sama. Misalnya variabel “perempuan” dan “anak” berapa pada kolom berbeda. Perhatikan susunan variabel pada gambar 15.
Gambar 15. Tangkapan layar dataset setelah dibersihkan.
Agar dataset ini mudah dianalisis menggunakan Spreadsheet, data harus diubah susunannya menjadi lebih sederhana. Caranya dengan membuat variabel baru berisi kabupaten/kota, tahun, jenis kekerasan, perempuan/anak, dan jumlah kasus di sheet baru yakni sheet 4.
Kemudian, masukkan formula Transpose untuk mengubah susunan variabel dari horizontal ke vertikal. Mula letakkan kursor di sel C2. Masukkan formula “=TRANSPOSE(Sheet3!C1:L1)” tanpa tanda kutip. Lalu, tekan enter. Hasilnya terlihat seperti terlihat pada gambar 16.
Susunan variabel terlihat berubah dari semula mendatar menjadi menurun. Kini, di sebelah kiri juga terdapat beberapa baris nama daerah yang sama dan tahun yang sama. Namun, ada perbedaan variabel baik perempuan atau anak-anak dan jenis kekerasan.
Gambar 16. Susunan dataset berubah menjadi vertikal setelah dibersihkan menggunakan formula Transpose.
Dataset ini siap diolah. Sebab, data tersaji menggunakan spreadsheet yang memungkinkan analisis statistik (seperti kali, bagi, tambah, kurang, dan persentase) dan visualisasi analisis dilakukan dengan mudah. Hal ini berbeda dengan data semula yang masih berupa PDF.
Ketersediaan dataset ini membuka peluang kolaborasi untuk dilakukan analisis lanjutan oleh jurnalis atau pihak lain yang memiliki perhatian yang sama terhadap isu perlindungan perempuan dan anak. Kolaborasi juga terbuka untuk memperluas cakupan wilayah yang akan dianalisis.
Menariknya, kolaborasi ini bisa dilakukan langsung dalam spreadsheet yang sama. Hal ini memastikan setiap kolaborator menggunakan perangkat dengan versi yang sama, tersimpan secara otomatis, dan praktis.
Penulis : Fachri Hamzah