Data besar dalam hal ini adalah data-data dengan jumlah record/baris, variabel/kolom maupun jumlah tabel-tabel yang banyak. Sebenarnya tidak ada batasan khusus untuk besarnya sebuah data, yang jelas dibutuhkan cara yang lebih efisien dan teliti dalam pengolahannya.
Mungkin kita sering melihat publikasi statistik di koran, buku, skripsi, dsb menampilkan angka, persen maupun bentuk chart; semua itu berasal dari angka-angka yang diperoleh dari data mentah. Sehingga orang awam mungkin tidak pernah mengetahui bagaimana angka tersebut muncul.
Artikel ini ingin mengulas tentang berbagai alat pengolah data besar yaitu berbagai software data processing yang banyak beredar di pasaran dan tentunya banyak digunakan. Data yang dicoba adalah data survei sosial ekonomi nasional (susenas) dengan baris: 277,002 dan kolom:128

MS Excel 2007
Microsoft Office Excel 2007 (XLS7) merupakan versi terbaru saat ini, dimana perubahannya sangat mendasar terutama dalam menu navigasinya. Sampai-sampai orang yang sudah mahir XLS versi sebelumnya harus belajar menghafal menu-menunya. Tetapi XLS7 ini ternyata mempunyai pengembangan yang luar biasa dalam kemampuan penyimpanan data.
Bagi saya sebagai pengolah data, paling terasa perubahannya adalah kemampuan menampung data sebanyak 1,048,576 baris dan 16,384 kolom, sangat memungkinkan untuk mengolah data survei besar seperti Susenas-BPS. Selain itu fasilitas pivot-tables lebih user friendly sehingga bisa membuat tabel dengan cepat, baik yang simple maupun dengan filter. Sayang sekali untuk data besar, ukuran file 2x lebih besar dibanding file dbf. Kecepatan tabulasi pivot-table masih lama dibandingkan dengan software lainnya. Walaupun hasil tabel yang dihasilkan sangat memuaskan, tetapi layout-nya masih kalah dibandingkan output SPSS.
SPSS
SPSS adalah software statistika yang paling populer, karena mudah penggunaannya. Ukuran file data yang dicoba hampir sama dengan format DBF, hanya saja proses penyimpanan cukup lama sekitar 10 detik. Begitu juga dalam pembentukan tabel hampir sama lamanya, tetapi lebih cepat dibandingkan dengan XLS7. Hasil tabel sangat memuaskan baik layout maupun isinya, selain itu bisa dengan mudah mengatur baris dan kolom sesuai selera dengan ‘pivoting tray’. Sayang sekali jika kita mau ulang tabulasi yang sama, harus mengikuti proses tabulasi dari awal. Syntax atau macro-nya SPSS cukup membantu dalam pengolahan yang berulang-ulang, hanya saja syntax yang dikeluarkan lewat menu di masing-masing fungsi kelihatan rumit dan susah untuk diikuti, apalagi bagi orang awam yang hanya mengandalkan menu. Kelebihan SPSS adalah fungsi statistikanya tidak terkalahkan baik oleh VFP maupun XLS7.
Visual Foxpro
Visual Foxpro (VFP) murupakan software microsoft yang sebenarnya fungsinya untuk database management seperti MS Access, bedanya adalah tabel-tabel di VPF merupakan file terpisah dengan format DBF sedangkan Access hanya 1 file untuk semua komponen database (tabel, form, query, dll). Karena terpisah inilah, kita bisa manfaatkan untuk pengolahan. Ukuran file DBF relatif kecil dibandingkan format lainnya, dan jika di kompres (zip) ratio kompresinya santa besar (file zip-nya jadi kecil sekali). Proses pengolahan data sangat cepat, apalagi dibandingkan dengan SPSS atau XLS7. Sayang dalam tabulasi tidak bisa menggunakan menu, tetapi harus menggunakan syntax dengan bahasa SQL. Jika belum pernah memang agak sulit, tetapi dengan belajar sedikit maka Anda akan merasakan kecepatan processingnya. Bentuk tabel yang dihasilkan tidak sebagus XLS atau SPSS, malah bisa dibilang masih kasar, sehingga harus diedit dahulu dengan XLS. Syntax atau program pengolahan bisa disimpan dan bisa dimodifikasi dengan mudah.
Software Lainnya
Ada beberapa software yang bisa digunakan seperti MS Access atau Excel 2003 (XLS3). Untuk Access, saya kurang berpengalaman dalam menggunakan. Sedangkan XLS3 fungsinya hampir sama dengan XLS7 tetapi kemampuan menampung file tidak sebesar XLS7 dan pivot tables nya kurang user friendly. Tapi bagi yang sudah biasa dengan XLS3 mungkin masih bisa diandalkan.
Kesimpulan
Ukuran file: VFP (.dbf) dan SPSS (.sav) mempunyai ukuran yang hampir mirip, tetapi .dbf lebih compatible dengan software lainnya. Kecepatan processing: VFP paling cepat, hanya saja output tabel masih kasar sehingga perlu waktu untuk editing di XLS. Menu tabulasi: XLS7 lebih user friendly. Programming tabulasi: program VPF lebih bagus dibading syntax SPSS. Output: SPSS lebih bagus baik layout maupun setting, XLS bagus dan bisa langsung pakai.
Jadi sesuaikan kemampuan Anda dalam pengolahan data, jika perlu pelajari software baru untuk menambah pengetahuan kita.
Filed under: Software, Statistika | Tagged: data, Excel, Foxpro, SPSS, Statistika










