Informasi Terbaru

Selasa, 24 September 2013

Pertemuan Ke 2. Sejarah Evaluasi



Evaluasi program seringkali didekati dari sudut pandang penelitian dan tidak jarang pula didekati dari sudut pandang ilmu pengelolaan. Penelitian pada umumnya menekankan evaluasi setalah program berlangsung (ex post facto) dan terpisah dari pengelolaan program. Kebalikannya, pengelolaan menekankan evaluasi pada saat program berlangsung dan sebagai bagian yang tak terpisahkan dari pengelolaan itu sendiri (perencanaan, pelaksanaan dan evaluasi). Pada sisi lain, penelitian juga melaksanakan evaluasi sebelum program berlangsung yang seringkali dikenal dengan istilah studi kelayakan untuk proyek dan identifikasi kebutuhan dan sumber belajar untuk bidang pendidikan. Begitu juga pengelolaan, ada kalanya melaksanakan evaluasi setelah program berlangsung untuk kepentingan pertanggungjawaban. Perbedaan kedua sudut pandang ini menjadi semakin tidak jelas pada waktu menentukan aspek apa dari program yang harus dievaluasi.

Sejarah perkembangan evaluasi program pendidikan formal dan nonformal tidak terlepas dari kedua pendekatan di atas. Dalam perjalanan yang cukup panjang lebih dari satu abad, evaluasi program telah berkembang begitu pesat sehingga sekarang tumbuh sebagai ilmu yang berdiri sendiri. Madaus dkk. (1983) telah berupaya untuk mempelajari sejarah perkembangan evaluasi program pendidikan    dan mengelompokkan menjadi enam masa perkembangan, yaitu : (1) masa pembaharuan, (2) masa efisiensi dan testing, (3) masa Tyler, (4) masa ‘innocence’, (5) masa ekspansi, dan (6) masa profesionalisasi. Dari masa pembaharuan sampai masa Tyler masih tergambar dengan jelas pendekatan mana yang dominan dalam pelaksanaan evaluasi program. Mulai masa innocence kedua pendekatan sudah mulai melebur yang akhirnya melahirkan pendekatan tersendiri.

Masa Pembaharuan

Masa pembaharuan berlangsung sekitar tahun 1800 – 1900. Pada masa ini telah terjadi revolusi industri disertai dengan perubahan ekonomi dan teknologi yang akhirnya mendasari terbentuknya struktur masyarakat modern dengan segenap akibatnya. Perubahan pesat dalam hal kesehatan mental dan pandangan hidup, kehidupan sosial dan kesadaran sosial, dan struktur agen-agen sosial. Pada akhirnya, perubahan ini mendorong usaha-usaha pembaharuan agen-agen sosial dan pendidikan beserta program-programnya, khususnya di Amerika Serikat dan di Inggris.
Pada masa ini telah dilaksanakan upaya-upaya untuk memperbaharui sistem pendidikan, undang-undang, rumah sakit, rumah yatim dan pelayanan kesehatan masyarakat. Evaluasi terhadap agen-agen sosial dan pendidikan ini seringkali bersifat informal dan mengandalkan kepada kesan dan perasaan yang dilaksanakan oleh Komisi yang ditunjuk oleh Pemerintah. umpamanya ‘Royal Commission of Inquiry’ untuk pendidikan dasar di Irlandia, setelah menerima kesaksian dan bukti-bukti, menarik kesimpulan bahwa kemajuan anak-anak di sekolah-sekolah negeri Irlandian jauh di bawah harapan. Atas dasar kesimpulan ini, Komisi menyampaikan rekomendasi untuk mengadopsi sistem ‘bayar berdasarkan hasil’ (payment by results) yang telah diterapkan di Inggris dan guru-guru digaji tergantung sebagian dari hasil ujian siswanya dalam hal membaca, menulis dan matematika. Contoh lain adalah “Royal Commission’ untuk rumah sakit cacar dan malaria, setelah melaksanakan evaluasi, menyampaikan rekomendasi bahwa pengobatan terhadap penyakit ini harus dibuka dan bebas untuk seluruh masyarakat. “Royal Commission’ ini masih dipakai di Inggris sampai sekarang untuk mengevaluasi beberapa area yang menjadi perhatian utama. Sedangkan di Amerika Serikat juga terdapat bentuk evaluasi yang seperti di Inggris yang dilakukan oleh ‘Presiden‘s Commission on School Finance’ dan ‘White House Panel on Non Public Education’.
Ketika pembaharuan program ditetapkan di Inggris, evaluasi periodik dilaksanakan melalui laporan tahunan yang disampaikan oleh Inspektor. Umpamanya, dalam bidang pendidikan terhadap inspektur-inspektur yang mengunjungi sekolah-sekolah setidap tahun dan membuat laporan tentang kondisi sekolah-sekolah dan hasil belajar siswa-siswanya. Dalam bidang lain, inspektur yang dibayar oleh Komisi Hukum untuk mengamati keluhan-keluhan terhadap ‘Poor Law Amendement Act of 1843’. Inspektur dari luar untuk mengkaji dan mengevaluasi sekolah-sekolah sampai saat ini masih dipertahankan di Inggris dan Irlandia.            Di Amerika Serikat, inspektur dari luar dipekerjakan oleh Pemerintah Federal dan beberapa negara bagian saja. Umpamanya, OSHA mempekerjakan inspektur dari luar sebagai  cara untuk melaksanakan evaluasi program telah mendapat perhatian utama di dalam literatur evaluasi.
Dalam sejarah evaluasi, dua perkembangan penting di Inggris yang perlu untuk diperhatikan. Pertama, pada pertengahan abad ke 19, sejumlah organisasi yang berdedikasi di bidang penelitian sosial telah menunjukkan karyanya. Organisasi-organisasi ini telah melaksanakan dan mempublikasikan temuan-temuan berkaitan dengan problema-problema sosial yang sangat merangsang munculnya diskusi di masyarakat. Kedua, dalam merespon terhadap temuan-temuan dari organisasi ini, birokrat pengelola program-program sosial kadang-kadang membentuk Komisi Pengkajian seperti ‘provincial workhouses’. Organisasi-organisasi ini sangat besar peranannya dalam menerapkan pendekatan empiris untuk evaluasi program.
Di Amerika Serikat usaha formal yang paling awal dalam mengevaluasi performance sekolah dimulai di Boston pada tahun 1845. Peristiwa ini penting artinya dalam sejarah evaluasi sebab dari sinilah mulai tradisi menggunakan skor tes siswa sebagai sumber data utama untuk mengevaluasi efektifitas program sekolah atau pengajaran. Kemudian atas desakan Samuel Gridley Howe ujian essay tertulis diperkenalkan ke sekolah-sekolah gramer yang ada di Boston oleh Horace Mann dan Dewan Pendidikan (Board of Education). Ujian essay tertulis diperkenalkan untuk menggantikan ujian lisan. Perkembangan berikutnya, model ujian ini secara administratif menyulitkan karena meningkatnya jumlah siswa dan dipandang tidak adil karena tidak bisa distandarisasi untuk seluruh siswa. Suatu hal yang menarik dalam arti evaluasi program adalah adanya agen kebijakan tersembunyi di samping gerakan ujian lisan; yaitu pengumpulan data untuk melakukan perbandingan yang dapat digunakan dalam pengambilan keputusan pada waktu pemilihan kepala sekolah. Howe dan Mann berupaya merekam hasil sekolah yang berbeda-beda dan menggunakan data ini untuk menjinakkan kepala-kepala sekolah yang menentang upaya mereka dalam menghapus hukuman fisik. Ini adalah contoh politisasi data evaluasi.
Antara tahun 1887 dan 1898 Joseph Rice melaksanakan apa yang umumnya dikenal dengan evaluasi formal yang pertama terhadap program pendidikan di Amerika. Dia melaksanakan studi perbandingan nilai drill pengajaran ‘spelling’ dan menemukan tidak terdapat perbedaan nilai yang berarti antara sistem yang menggunakan waktu 200 menit pengajaran spelling dengan yang hanya 10 menit per minggu. Hasil evaluasi Rice membuat pendidik mengkaji kembali dan akhirnya merevisi metode mereka dalam mengajarkan spelling.
Kemajuan evaluasi program pendidikan nonformal ternyata tidak sepesat evaluasi pendidikan formal. Program pendidikan nonformal yang dilaksanakan oleh universitas-universitas di Amerika yang disajikan untuk petani dan buruh-buruh tambang belum mendapat perhatian untuk dievaluasi secara formal. Karena sifat program adalah nonformal dari sudut pandang universitas, maka evaluasi formal belum mendapat perhatian. Begitu juga di Inggris, program-program pendidikan nonformal belum dievaluasi seccara formal baik yang dilaksanakan dengan label pendidikan baca tulis, university extension maupun dengan label agriculture extension.
Dari uraian di atas dapat disimpulkan bahwa pada mulanya evaluasi program pendidikan bersifat informal dan bertumpu pada kesan pelaksana evaluasi. Evaluasi program pendidikan baru dilaksanakan secara formal setelah menjelang akhir abad 19 dan menjadikan hasil belajar siswa sebagai aspek utama evaluasi. Evaluasi program masa ini masih berfokus pada pendidikan formal.

Masa Efisiensi dan Testing

Masa efisiensi dan testing berlangsung sekitar tahun 1900 – 1930. Pada     masa ini, gagasan pengelolaan yang berlandaskan ilmiah menjadi pendorong teori administrasi di bidang pendidikan dan industri. Penekanan gagasan ini terletak pada sistemik, standarisasi  dan yang terpenting adalah efisiensi. Sesuatu program harus dievaluasi efisiensinya dan untuk ini tes menjadi alat utama evaluasi.
Banyak survey yang dilaksanakan di sekolah-sekolah berfokus pada efisiensi sekolah dan guru dan menggunakan bermacam-macam kriteria seperti tingkat putus sekolah siswa dan rata-rata jumlah kenaikan kelas. Pada tahun 1915 empat puluh sekolah di Amerika Serikat telah melaksanakan atau sedang melakukan survey menyeluruh yang meliputi seluruh tahap program pendidikan. Sejumlah survey menggunakan tes objektif dalam bidang matematika, spelling, tulisan dan komposisi bahasa Inggris untuk menentukan efisiensi pengajaran. Tes juga dikembangkan dan digunakan untuk mengukur efisiensi program pendidikan di negara-negara bagian Amerika seperti yang dikembangkan oleh Departemen Penelitian dan Pengukuran Pendidikan di Boston. Prosentase kelulusan siswa berdasarkan hasil tes digunakan oleh guru untuk membuat jastifikasi apakah sekolah mereka di bawah atau di atas rata-rata standar untuk kota mereka. Berikutnya tes dikembangkan oleh para peneliti seperti Courtis dan Ayers untuk mengukur secara tepat tujuan pengajaran.
Sejalan dengan pertumbuhan standarisasi tes achievement setelah perang dunia kesatu, sekolah-sekolah negara bagian di Amerika menggunakan tes untuk menentukan efektifitas peogram. Umpamanya, May menemukan bahwa tes achivement yang tersedia secara komersil khusus yang dibuat oleh Biro Penelitian Distrik, digunakan untuk mendiagnosa secara khusus kelemahan sistem dan untuk mengevaluasi kurikulum dan performance keseluruhan sistim. Di samping itu tes digunakan untuk membuat keputusan tentang individu. Universitas juga tidak ketinggalan membentuk lembaga khusus untuk melakukan evaluasi yang diperlukan oleh negara bagian. Institut-institut ini dapat dianggap sebagai pendahuluan dari pusat-pusat di universitas yang berdedikasi dalam bidang evaluasi yang tumbuh pada tahun 1960-an dan 70-a di negara maju dan pada tahun 1980-an di negara berkembang. Di Indonesia pada umunya evaluasi dilakukan oleh pusat-pusat atau lembaga penelitian.
Pada awal masa ini (1900 – 1930), evaluasi seringkali disalahgunakan. Seringkali  beberapa penduduk setempat mengundang pakar-pakar evaluasi untuk mengekpose kelemahan-kelemahan lembaga-lembaga pendidikan dan pengembangan masyarakat dan mengusulkan saran-saran perbaikan. Padahal evaluasi semestinya bukan hanya untuk melihat kelemahan program saja. Di samping itu, hasil-hasil evaluasi yang bersifat objektif dipergunakan sebagai propoganda untuk membendung meningkatnya kritik masyarakat terhadap lembaga-lembaga pendidikan. Sangat disayangkan evaluator pada saat ini tidak menyadari bahwa survey untuk melakukan evaluasi dapat dan harus menghindari penyalahgunaan dan dilakukan untuk y hal yang konstruktif, dikerjakan bekerja sama dengan advisor setempat dan dirancang untuk menciptakan dukungan publik terhadap perubahan yang tidak dikenal tetapi diperlukan.
Dari uraian di atas dapat ditarik kesimpulan bahwa evaluasi lebih ditunjuk untuk melihat efisiensi suatu program dan tes dijadikan alat utama evaluasi. Pendidikan formal menjadi perhatian utama pakar-pakar evaluasi. Aspek program yang dievaluasi masih terbatas pada hasil belajar (sebagian dari out put program). Evaluasi program-program pendidikan nonformal masih belum mendapat perhatian pakar-pakar evaluasi.

Masa Tyler

Masa Tyler ini berlangsung sekitar tahun 1930 – 1945.  Dinamakan masa Tyler, karena pada masa itu pengaruh Tyler sangat besar dalam bidang evaluasi pendidikan khususnya dalam bidang testing. Dia dianggap sebagai “nabinya” evaluasi. Dia bekerja mulai dari mengkonsepsionalkan suatu pandangan inovatif dalam bidang kurikulum dan evaluasi. Kurikulum ditempatkan sebagai satu set pengalaman sekolah yang terencana secara luas. Dirangsang dan diterapkann untuk menolong siswa dalam menguasai perilaku khusus. Istilah evaluasi pendidikan diartikan mengukur seberapa jauh objektif program pengajaran telah dicapai. Kemudian kosep ini pada tahun 1930-an digunakan oleh Tyler untuk menolong instruktur-instruktur di negara bagian OHIO Amerika Serikat untuk meningkatkan kursus-kursus yang mereka organisir dan tes yang dipergunakan mereka.
Pada saat ini Amerika Serikat mengalami krisis ekonomi. Akibatnya lembaga-lembaga pendidikan dan lembaga-lembaga lainnya mengalami kekurangan sumber-sumber non manusia dan tumbuhnya perasaan pesimis pada diri pengelolanya. Pemerintah Amerika Serikat berupaya untuk mengatasi krisis ekonomi dan pakar-pakar pendidikan (John Dewey dkk) melaksanakan pembaharuan pendidikan untuk menopang upaya-upaya pemerintah. Pembaharuan dikenal dengan istilah gerakan pendidikan progresif. Tyler ikut bergabung dengan gerakan ini memimpin studi evaluasi terhadap pembaharuan yang dikenal dengan istilah ‘studi delapan tahun’ yang disponsori oleh Carnegia Corporation.
Studi evaluasi yang dipimpin oleh Tyler adalah studi yang terbesar dan pertama kali tentang perbedaan efektivitas bermacam-macam tipe persekolahan. Masalah  (pertanyaan) evaluasi adalah kemanjuran (efficacy) program sekolah menengah tradisional dibandingkan dengan sekolah menengah progresif. Hasil evaluasi mengakibatkan lembaga-lembaga pendidikan tinggi menolak untuk menerima lulusan sekolah menengah progresif karena tidak memiliki kredit untuk beberapa mata pelajaran tertentu. Setelah dilaksanakan perdebatan cukup sengit, lebih jauh dari 300 lembaga pendidikan setuju melaksanakan eksperimen untuk membandingkan performance mahasiswa di lembaga pendidikan tinggi yang berasal dari sekolah menengah tradisional dan progresif.

Dampak dari studi delapan tahun antara lain adalah pendidikan di Amerika Serikat mengenal istilah evaluasi yang pengertiannya lebih luas daripada sebelumnya, yaitu pada masa efesiensi dan testing. Evaluasi adalah perbandingan antara hasil yang diharapkan dan hasil aktual. Evaluasi meliputi perbandingan antara hasil dengan objektif  program dan tidak perlu harus menggunakan design penelitian dengan biaya tinggi dan membagi menjadi kelompok eksperimen dan kontrol. Aspek yang dievaluasi adalah hasil belajar bukan input pengajaran dan organisasi sehingga tidak memerlukan jastifikasi dari evaluator profesional. Karena pengukuran dilaksanakan atas dasar objektif program yang telah didefinisikan secara operasional, maka tidak terlalu perlu memikirkan reliabilitas perbedaan skor siswa/mahasiswa. Pada pertengahan tahun 1940 gagasan Tyler yang dituangkan dalam bentuk tulisan menjadi fondasi evaluasi program pada umumnya. Sampai sekarang ini konsep ini Tyler dianut cukup luas oleh evaluator dan telah dikembangkan sesuai dengan kebutuhan setempat.
Pada masa ini evaluasi untuk pendidikan nonformal sudah mulai dikembangkan. Istilah fungsional literacy mulai dikenal pada waktu perang dunia kedua. Tentara yang direkrut oleh Amerika Serikat dites kemampuan baca tulis mereka yang diperlukan dalam melaksanakan tugas ketentaraan. Mereka yang belum memiliki kemampuan baca tulis fungsional harus mengikuti training khusus baca tulis.
Amerika, Inggris dan beberapa negara maju lainnya sudah melaksanakan intensifikasi pertanian. Pekerja-pekerja extension dari departemen pertanian diterjunkan untuk membantu petani mengikuti dan menerapkan temuan-temuan baru yang berguna untuk membantu petani mengikuti dan menerapkan temuan-temuan baru yang berguna untuk mereka. Evaluasi terhadap program-program pengembangan masyarakat lebih banyak dilaksanakan dalam bentuk studi tentang output, yaitu peningkatan hasil pertanian itu sendiri. Studi evaluasi ini dilaksanakan bukan oleh evaluator, tetapi para peneliti dalam bidang pertanian.
Dari uraian di atas disimpulkan bahwa evaluasi program pendidikan sudah meliputi program pendidikan nonformal, walaupun perhatian utama evaluator masih pada pendidikan formal. Evaluasi terhadap program pendidikan nonformal untuk pengembangan masyarakat sudah mulai dilaksanakan oleh peneliti dalam bidang pertanian. Aspek program yang dievaluasi adalah output program.

Masa Innocence

Masa ‘innocence’ ini berlangsung antara tahun 1946 – 1957 atau disebut juga tahun masa bodoh, khususnya di Amerika Serikat. Pada masa ini keputusan, prasangka dan permusuhan sosial terjadi di daerah pedesaan dan perkotaan. Tetapi tidak ada orang kulit putih yang memperhatikan keadaan ini sebagai masalah sosial. Di samping itu, juga pola hidup konsumtif dan penggunaan sumber-sumber seperti   itu suatu saat akan habis. Pada masa ini juga, pembangunan industri dan militer        secara besar-besaran dilaksanakan tanpa memperhatikan konsekuensi-konsekuensi negatifnya.
Dalam bidang pendidikan, perluasan pemberian kesempatan belajar, penambahan personal dan fasilitas dilaksanakan di Amerika Serikat dan Inggris seccara besar-besaran. Pembangunan gedung-gedung baru dan lembaga-lembaga pendidikan baru, lembaga-lembaga pendidikan membangun dan menyajikan pelayanan kesehatan mental dan fisik, bimbingan dan penyuluhan, pendidikan masyarakat dan program-program pendidikan nonformal seperti drama, musik dan olah raga. Mahasiswa-mahasiswa baru yang mendaftar di perguruan tinggi meningkat jumlahnya. Dengan cara ini masyarakat telah melupakan perang yang baru saja selesai dan berupaya untuk meningkatkan kualitas dan kuantitas hidup mereka.
Pembangunan dan peningkatan pendidikan mempunyai dampak terhadap evaluasi program dan hasilnya. Pada masa ini pengembangan teknik-teknik evaluasi telah tumbuh dengan pesat sejalan dengan perkembangan dalam bidang teknologi. Dua macam design evaluasi telah berkembang dengan pesat untuk eksperimen yang menggunakan kelompok kontrol dan design yang hanya membandingkan antara hasil dan objektif. Penggunaan testing sebagai alat evaluasi telah menyebar secara luas. Bahkan testing telah distandarisasi untuk tingkat nasional di Amerika Serikat. Sekolah-sekolah memberi test yang sudah distandarisasi bahkan disertai dengan mesin-mesin untuk memberikan skor dan menganalisa hasil evaluasi.
Penerapan testing terstandar telah tersebar luas sekali. Tidak hanya untuk Amerika tetapi juga negara-negara lainnya. Organisasi-organisasi profesional telah menyusun dan mengembangkan bermacam tes sesuai dengan keperluan. Tahun 1954 Panitia dari Assosiasi Ilmu Jiwa Amerika menyiapkan rekomendasi untuk tes-tes kejiwaan dan teknik diagnostik. Tahun 1955 panitia-panitia dari AERA dan NCMUE menyiapkan rekomendasi teknis untuk tes achievement. Dua laporan ini menjadi basis untuk ‘Standars for Educational and Psychological Tests and Manuals’ pada tahun 1965 yang direvisi pada tahun 1974 dengan titel baru ‘Standars for Educational ad Psycological Tests’.
Lindquist mengembangkan lebih jauh lagi prinsip-prinsip statistik design experimental untuk kepentingan untuk kepentingan evaluasi program. Beberapa tahun kemudian banyak evaluator dan pendidik menghadapi masalah dalam berusaha untuk memenuhi secara keseluruhan asumsi yang diperlukan dalam design experiment seperti treatment yang berlaku secara konstan dan subyek yang dipasangkan secara random. Di samping ini, pengembangan teknik-teknik evaluasi atas dasar pandangan Tyler juga berkembang dengan pesat. Penterapan gagasan Tyler memerlukan tujuan program yang dinyatakan secara eksplisit. Hal ini memerlukan teknik-teknik yang dapat membantu para pendidik untuk dapat merumuskan tujuan program pengajaran mereka secara eksplisit dengan menggunakan taksonomi yang tepat.
Walaupun teknik evaluasi telah berkembang pesat, sedikit sekali terdapat bukti bahwa evaluasi program telah dilaksanakan baik di lembaga-lembaga pendidikan maupun pengembangan masyarakat. Walaupun sebagian program ada yang dievaluasi,k pendidik-pendidik formal dan pengelola pendidikan nonformal jarang menggunakan hasil evaluasi untuk perbaikan program. Anehnya, masyarakat dan penyandang dana program tidak menuntut laporan pertanggungjawaban pelaksanaan program dengan kata lain mereka acuh tak acuh.
Dari uraian di atas dapat disimpulkan bahwa teknik-teknik evaluasi sudah semakin pesat perkembangannya, tetapi sedikit sekali penerapannya di lapangan. Pelaksanaannya dan evaluasi dan penggunaannya untuk peningkatan program jarang dilaksanakan karena masyarakat pada umumnya dan penyandang dana pada khususnya memang tidak menuntut pertanggungjawaban pelaksana program baik pendidik formal maupun nonformal yang ditujukan untuk pengembangan masyarakat.

Masa Ekspansi

Masa ini berlangsung sekitar tahun 1958 – 1972. Di awal masa ini Amerika Serikat mengalami kekagetan dengan kemampuan Uni Soviet yang mampu meluncurkan Sputinik I tahun 1959. Seperti yang dikatakan Popham (1974) Amerika termasuk bangsa yang ingin terbaik dalam segala hal. Karena itu mereka perlu meninjau kembali sistem pendidikan yang menghasilkan tenaga-tenaga ahli dan mengevaluasi mengapa sampai ketinggalan dengan Uni Soviet. Atas dasar ini program matematika dan sains dimasukkan ke dalam kurikulum dan bahkan menjadi kurikulum utama dengan harapan bukan hanya sekedar mengejar ketinggalan, tetapi ingin melampaui Uni Soviet yang menjadi saingan utama mereka.
Dengan menggunakan model-model dan teknik evaluasi yang sudah ada ternyata tidak menolong pengembang-pengembang kurikulum, program pendidikan dan pengembangan masyarakat. Selain itu, hasil evaluasi bukan sebagai respon terhadap pertanyaan-pertanyaan yang dikemukakan oleh orang-orang yang ingin mengetahui efektifitas program. Para evaluator menyadari masalah ini setelah mereka dengan dana yang cukup besar dan dengan cermat menerangkan teknik evaluasi yang sudah ada pada saat itu dan menghasilkan sesuatu yang tidak berguna untuk pengembangan kurikulum dan program-program lagi.
Cronbach menilai negatif pelaksanaan-pelaksanaan evaluasi pada saat itu. Evaluasi dinilai kurang relevan dan kurang bermanfaat dan menyarankan kepada evaluator untuk banting dari model-model dan teknik evaluasi yang sudah ada. Cronbach mengemukakan gagasan tentang evaluasi yang lebih komprehensif dari pada gagasan Tyler, yaitu pengumpulan dan pengunaan informasi untuk pengambilan keputusan tentang progran pendidikan. Terdapat tiga macam tipe keputusan menurut Cronbach : keputusan tentang perbaikan pendidikan, tentang individu dan tentang peraturan administratif. Untuk membantu pengambilan keputusan, evaluasi harus meliputi studi proses, pengukuran kepandaian dan kecakapan, pengukuran sikap studi follow up. Perlu diperhatikan performance siswa bukan satu-satunya kriteria untuk menentukan keberhasilan program. Pandangan Cronbach menjadi pemula untuk model-model evaluasi yang beriorentasi kepada ‘decision facilitation’ baik untuk program-program pendidikan maupun pengembangan masyarakat.   
Pada tahun 1956 amerika serikat memproklamirkan perang terhadap kemiskinan.  Program-program dengan biaya trilyun dolar dimaksudkan untuk menyamakan dan meningkatkan kesempatan bagi seluruh warga negara dalam bidang pelayanan pendidikan, sosial dan kesehatan. Dana yang besar ini mungkin akan terbuang percuma bila pelaksana-pelaksana program tidak diharuskan mempertanggungjawabkannya kepada pemberi dana. Senator Robert Kennedy dkk. anggota konggres setuju untuk mengharuskan evaluasi khusus dalam program ESEA. Sekolah-sekolah negara bagian yang menerima dana untuk menyajikan program pendidikan pengganti atau pendidikan nonformal bagi anak-anak tidak mampu diharuskan melaksanakan evaluasi tahunan untuk mengetahui seberapa jauh tujuan program telah tercapai. Pada saat ini evaluator mulai merubah titik berat mereka dari persoalan teori evaluasi ke pelaksanaan teori itu sendiri di lapangan.
Dari pelaksanaan evaluasi sebagai persyaratan penerima dana ternyata dapat diketahui dengan jelas bahwa teknik-teknik evaluasi yang diterapkan tidak tepat digunakan dalam mengevaluasi program ESEA. Khususnya tes standar yang telah dirancang untuk siswa yang berasal dari masyarakat kelas menengah ke atas tidak cocok untuk siswa kurang mampu yang latar belakang pendidikan mereka tertinggal di belakang siswa yang berasal dari kelas menengah tersebut. Penggunaan tes standar bertentangan dengan konsep evaluasi Tyler. Tes standar tidak menerima kemungkinan perbedaan antara daerah yang satu dengan daerah yang lainnya, sedangkan Tyler membolehkan adanya perbedaan. Lebih jauh lagi, hasil evaluasi tidak memberikan informasi tentang tingkat kebutuhan anak-anak tidak mampu yang dapat digunakan oleh guru-guru dalam menyatakan tujuan-tujuan program. Pada akhirnya, karena penggunaan design program dan alat evaluasi yang tidak tepat maka hasilnya tidak mampu menunjukkan hasil program secara tepat.
Setelah melihat hasil evaluasi yang berkenaan dengan output program selalu negatif, Phi Delta Kappa membentuk suatu Komisi Studi Evaluasi Nasional. Berdasarkan hasil survey, Komisi berkesimpulan bahwa evaluasi program-program pendidikan mengalami sakit parah dan menghimbau pakar-pakar evaluasi untuk mengembangkan teori-teori dan metode baru dan program-program training baru untuk evaluator. Hasilnya, banyak konsep-konsep baru dikembangkan untuk membenahi teori-teori evaluasi yang sudah kurang tepat. Reformasi terhadap konsep-konsep Tyler dilakukan oleh Provus, Hamond, Eisner, Metfessel dan Michael. Claser, Popham dan Tyler mengajukan ‘creterium referenced testing’ sebagai alternatif dari ‘norm referenced testing’. Scriven menyumbangkan konsep ‘goal-free’, Stufflebeam dan Alkin menyumbangkan konsep ‘decision facilitation’, dan lain-lain. Scriven, Stufflebeam dan Alkin menyumbangkan konsep yang berbeda dengan Tyler dan pendukung-pendukungnya. Evaluasi meliputi output proses, input dan konteks dari program itu sendiri. Evaluasi output termasuk evaluasi terhadap tujuan, hasil yang diharapkan dan tidak diharapkan.
Evaluasi program tidak hanya terbatas untuk pendidikan formal, tetapi sudah mulai dikembangkan teori-teori evaluasi yang cocok untuk pendidikan nonformal seperti yang dikembangkan oleh Paulo Freire dan Meziro W. Untuk evaluasi program pendidikan nonformal banyak dikembangkan teori-teori partisipator yang berasal dari penelitian partisipatori dan evaluasi demokratis yang semula diterapkan untuk pendidikan formal. Lebih jauh lagi, teori-teori evaluasi dikembangkan dengan pesat tidak hanya di Amerika Serikat tetapi juga di Inggris seperti illmuminative evaluation yang dikembangkan oleh Parlett dan Hamilton.
Dari uraian di atas dapat ditarik kesimpulan bahwa pengembangan teori dan teknik evaluasi sejalan dengan penerapan di lapangan. Bermacam-macam model evaluasi program yang berbeda-beda, baik di bidang pendidikan formal maupun nonformal. Aspek-aspek program yang dievaluasi tidak hanya terbatas pada output program saja, tetapi meliputi konteks, input dan prosesnya.

Masa Profesionalisasi

Masa profesionalisasi berlangsung mulai tahun 1973 sampai sekarang ini. Evaluasi sudah tumbuh menjadi profesi tersendiri yang tidak sama dengan penelitian dan testing. Walaupun teknik pengumpulan data dan penentuan sampel mungkin saja penelitian tetapi tingkat generalisasinya tidak sejauh penelitian, khususnya dalam hal waktu dan instansinya. Dalam evaluasi program, tes mungkin digunakan, tetapi penggunaannya hanya sebagai bagian dari evaluasi yang lazim disebut dengan istilah produk. berikut ini akan didiskusikan perkembangan profesionalisasi evaluasi program pendidikan dan pengembangan masyarakat.
Pada mulanya evaluator merasakan adanya krisis identitas. Mereka tidak yakin apakah mereka harus masuk kubu peneliti, tester atau administrator dan kualifikasi apa yang harus dimiliki. Tidak banyak majalah evaluasi program yang dapat digunakan oleh evaluator untuk bertukar hasil evaluasi dan gagasan. Belum ada organisasi profesional yang berdedikasi terhadap evaluasi sebagai disiplin tersendiri. Pada dasarnya belum ada buku literatur evaluasi program kecuali sekedar masalah yang tidak diterbitkan. Lebih buruk lagi, evaluasi banyak dilaksanakan oleh orang-orang yang bukan dipersiapkan untuk itu (amatiran). Untuk mengatasi krisis ini, evaluasi program perlu diprofesionalisasikan. Majalah-majalah diterbitkan seperti Educational Evaluation and Policy Analysis, Hindies in Evaluation, CEDR Quarterly, Evaluation Review, New Direction for Program Evaluation dan lain-lain. Majalah-majalah ini menjadi alat efektif untuk merekam dan menyebarluaskan informasi tentang evaluasi program.
Banyak universitas dan institut mulai memberikan minimal satu matakuliah metodologi evaluasi. Dalam hal ini termasuk jurusan Pendidikan Luar Sekolah (Negeri IKIP Malang). Lebih jauh lagi beberapa universitas membuka program Pasca Sarjana dalam bidang evaluasi seperti University of Illinois, Stanford University, Boston College UCLA dan University of Mimmosata. Nova University mungkin yang termasuk pertama menyajikan matakuliah evaluasi di tingkat doktoral. Departemen pendidikan Amerika Serikat telah mensponsori program-program training untuk evaluasi dan organisasi-organisasi profesional telah menyajikan program-program lokakarya evaluasi. Pusat-pusat studi evaluasi telah didirikan dan dikembangkan di negara-negara maju dan berkembang. Sejalan dengan pesatnya program pembangunan ini negara berkembang termasuk diantaranya bidang pendidikan dan pengembangan masyarakat, evaluasi perlu dilaksanakan oleh kelompok-kelompok profesional. Umpamanya, evaluasi program kerjasama RI – UNICEF di bidang PLS diserahkan kepada Pusat Penelitian IKIP Malang. Contoh lain, banyak evaluasi program yang diperlukan oleh BAPPEDA Jawa Timur diserahkan kepada evaluator-evaluator dari universitas dan institut dan lembaga profesional lainnya. Sejalan dengan profesionalisasi evaluasi, disiplin ini memerlukan cara untuk menilai dan menentukan kualitas evaluasi. Untuk ini meta evaluasi dipandang sebagai  salah satu cara yang tepat.
Pada masa ini pada evaluator menyadari bahwa teknik-teknik evaluasi yang harus membuahkan hasil yang memadai ditinjau dari sudut metodologi penelitian, dapat menyajikan informasi yang dibutuhkan oleh klien, mengangkat isu-isu sentral, terkait dengan realitas situasi, memenuhi persyaratan kejujuran dan ketelitian. Teknik-teknik yang memenuhi persyaratan ini sedang dikembangkan seperti goal-free, adversary, meta analysis, responsive evaluation dan naturalistic evaluation. Webster dan kawan-kawan telah mengoperasionalkan konsep CIPP Stuffelebeam untuk diterapkan dalam ruang lingkup sekolah. Bhola telah mengembangkan nation ideology approach untuk membuat model evaluasi yang tepat untuk masing-masing negara yang berbeda ideologinya. Stake telah mengadopsi model studi kasus untuk diterapkan dalam evaluasi program khususnya untuk pendidikan yang berlangsung di luar sistem persekolahan dan untuk program-program pengembangan masyarakat. Banyak lagi pakar evaluasi, selain yang disebutkan di sini, mengembangkan teknik evaluasi yang dapat memenuhi persyaratan yang telah ditetapkan di atas.
Profesionalisasi evaluasi telah melahirkan hasil campuran seperti yang dikemukakan oleh Madaus (1983). Pertama, tidak diragukan adanya komunikasi yang lebih baik dan intensif dalam bidang evaluasi, di samping juga menimbulkan banyak gunjingan. Kedua, pada waktu terjadi peningkatan training dan kewenangan evaluator untuk meyakinkan bahwa lembaga-lembaga pemesan mendapat pelayanan dari orang-orang yang qualified, beberapa pengamat cemas bahwa pengembangan ini akan menimbulkan klub yang ekslusif dan berpandangan sempit. Ketiga, kerjasama di antara organisasi-organisasi profesional yang bergerak dalam bidang evaluasi program pendidikan adalah suatu hal yang positif, tetapi juga gampang buyar, untuk mempromosikan dan melaksanakan kerja evaluasi yang berkualitas tinggi. Keempat, pembentukan organisasi-organisasi profesional baru telah meningkatkan komunikasi antar evaluator dan mengurangi fragmentasi dalam bidang evaluasi. Pada sisi lain masih terdapat perbedaan yang tajam antara Divisi H dari AERA, Jaringan Kerja Evaluasi dan Masyarakat Reseach Amerika. Khusus untuk persoalan pertama sampai ketiga tidak hanya terjadi di Amerika, tetapi merupakan persoalan dunia.
Masalah lain yang mendasar adalah perbedaan antara pendekatan kualitatif dan kuantitatif dalam evaluasi program. Perbedaan bukan hanya sekedar teknik, tetapi landasan filosifis. Kualitatif berangkat dari subjectivitist epistemology yang menempatkan kebenaran tidak terlepas dari kontek dan pengetahuan adalah persepsi dan pemahaman individu terhadap realita. Kuantitatif berangka dari objectivist epistemology yang menempatkan kebenaran terlepas dari kontek. Karena itu pengetahuan adalah realita yang terlepas dari persepsi individu. Evaluator yang kurang awas seringkali menggabungkan dua teknik dari pendekatan yang berbeda ini dan akhirnya mungkin akan membuahkan hasil evaluasi yang menyesatkan.
Dari uraian di atas dapat disimpulkan bahwa evaluasi telah mampu untuk menjadi profesi tersendiri. Banyaknya teknik-teknik, metode-metode dan pendekatan evaluasi mengharuskan evaluator untuk memilih salah satu atau mungkin mengembangkan teknik atau metode baru yang sesuai dengan kontek di mana evaluasi dilaksanakan.


Tidak ada komentar:

Posting Komentar