Evaluasi program seringkali
didekati dari sudut pandang penelitian dan tidak jarang pula didekati dari
sudut pandang ilmu pengelolaan. Penelitian pada umumnya menekankan evaluasi
setalah program berlangsung (ex post facto) dan terpisah dari pengelolaan
program. Kebalikannya, pengelolaan menekankan evaluasi pada saat program
berlangsung dan sebagai bagian yang tak terpisahkan dari pengelolaan itu
sendiri (perencanaan, pelaksanaan dan evaluasi). Pada sisi lain, penelitian
juga melaksanakan evaluasi sebelum program berlangsung yang seringkali dikenal
dengan istilah studi kelayakan untuk proyek dan identifikasi
kebutuhan dan sumber belajar untuk bidang pendidikan. Begitu juga
pengelolaan, ada kalanya melaksanakan evaluasi setelah program berlangsung
untuk kepentingan pertanggungjawaban. Perbedaan kedua sudut pandang ini menjadi
semakin tidak jelas pada waktu menentukan aspek apa dari program yang harus
dievaluasi.
Sejarah perkembangan evaluasi program pendidikan formal
dan nonformal tidak terlepas dari kedua pendekatan di atas. Dalam perjalanan
yang cukup panjang lebih dari satu abad, evaluasi program telah berkembang
begitu pesat sehingga sekarang tumbuh sebagai ilmu yang berdiri sendiri. Madaus
dkk. (1983) telah berupaya untuk mempelajari sejarah perkembangan evaluasi
program pendidikan dan mengelompokkan
menjadi enam masa perkembangan, yaitu : (1) masa pembaharuan, (2) masa
efisiensi dan testing, (3) masa Tyler, (4) masa ‘innocence’, (5) masa ekspansi,
dan (6) masa profesionalisasi. Dari masa pembaharuan sampai masa Tyler masih
tergambar dengan jelas pendekatan mana yang dominan dalam pelaksanaan evaluasi
program. Mulai masa innocence kedua pendekatan sudah mulai melebur yang akhirnya
melahirkan pendekatan tersendiri.
Masa Pembaharuan
Masa pembaharuan berlangsung sekitar tahun 1800 – 1900.
Pada masa ini telah terjadi revolusi industri disertai dengan perubahan ekonomi
dan teknologi yang akhirnya mendasari terbentuknya struktur masyarakat modern
dengan segenap akibatnya. Perubahan pesat dalam hal kesehatan mental dan
pandangan hidup, kehidupan sosial dan kesadaran sosial, dan struktur agen-agen
sosial. Pada akhirnya, perubahan ini mendorong usaha-usaha pembaharuan
agen-agen sosial dan pendidikan beserta program-programnya, khususnya di
Amerika Serikat dan di Inggris.
Pada masa ini telah dilaksanakan upaya-upaya untuk
memperbaharui sistem pendidikan, undang-undang, rumah sakit, rumah yatim dan
pelayanan kesehatan masyarakat. Evaluasi terhadap agen-agen sosial dan
pendidikan ini seringkali bersifat informal dan mengandalkan kepada kesan dan
perasaan yang dilaksanakan oleh Komisi yang ditunjuk oleh Pemerintah. umpamanya
‘Royal Commission of Inquiry’ untuk pendidikan dasar di Irlandia, setelah
menerima kesaksian dan bukti-bukti, menarik kesimpulan bahwa kemajuan anak-anak
di sekolah-sekolah negeri Irlandian jauh di bawah harapan. Atas dasar
kesimpulan ini, Komisi menyampaikan rekomendasi untuk mengadopsi sistem ‘bayar
berdasarkan hasil’ (payment by results) yang telah diterapkan di Inggris dan
guru-guru digaji tergantung sebagian dari hasil ujian siswanya dalam hal
membaca, menulis dan matematika. Contoh lain adalah “Royal Commission’ untuk
rumah sakit cacar dan malaria, setelah melaksanakan evaluasi, menyampaikan
rekomendasi bahwa pengobatan terhadap penyakit ini harus dibuka dan bebas untuk
seluruh masyarakat. “Royal Commission’ ini masih dipakai di Inggris sampai
sekarang untuk mengevaluasi beberapa area yang menjadi perhatian utama. Sedangkan
di Amerika Serikat juga terdapat bentuk evaluasi yang seperti di Inggris yang
dilakukan oleh ‘Presiden‘s Commission on School Finance’ dan ‘White House Panel
on Non Public Education’.
Ketika pembaharuan program ditetapkan di Inggris,
evaluasi periodik dilaksanakan melalui laporan tahunan yang disampaikan oleh
Inspektor. Umpamanya, dalam bidang pendidikan terhadap inspektur-inspektur yang
mengunjungi sekolah-sekolah setidap tahun dan membuat laporan tentang kondisi
sekolah-sekolah dan hasil belajar siswa-siswanya. Dalam bidang lain, inspektur
yang dibayar oleh Komisi Hukum untuk mengamati keluhan-keluhan terhadap ‘Poor
Law Amendement Act of 1843’. Inspektur dari luar untuk mengkaji dan
mengevaluasi sekolah-sekolah sampai saat ini masih dipertahankan di Inggris dan
Irlandia. Di Amerika Serikat,
inspektur dari luar dipekerjakan oleh Pemerintah Federal dan beberapa negara
bagian saja. Umpamanya, OSHA mempekerjakan inspektur dari luar sebagai cara untuk melaksanakan evaluasi program
telah mendapat perhatian utama di dalam literatur evaluasi.
Dalam sejarah evaluasi, dua perkembangan penting di
Inggris yang perlu untuk diperhatikan. Pertama, pada pertengahan abad ke 19,
sejumlah organisasi yang berdedikasi di bidang penelitian sosial telah
menunjukkan karyanya. Organisasi-organisasi ini telah melaksanakan dan
mempublikasikan temuan-temuan berkaitan dengan problema-problema sosial yang
sangat merangsang munculnya diskusi di masyarakat. Kedua, dalam merespon
terhadap temuan-temuan dari organisasi ini, birokrat pengelola program-program
sosial kadang-kadang membentuk Komisi Pengkajian seperti ‘provincial
workhouses’. Organisasi-organisasi ini sangat besar peranannya dalam menerapkan
pendekatan empiris untuk evaluasi program.
Di Amerika Serikat usaha formal yang paling awal dalam
mengevaluasi performance sekolah dimulai di Boston pada tahun 1845. Peristiwa
ini penting artinya dalam sejarah evaluasi sebab dari sinilah mulai tradisi
menggunakan skor tes siswa sebagai sumber data utama untuk mengevaluasi efektifitas
program sekolah atau pengajaran. Kemudian atas desakan Samuel Gridley Howe
ujian essay tertulis diperkenalkan ke sekolah-sekolah gramer yang ada di Boston
oleh Horace Mann dan Dewan Pendidikan (Board of Education). Ujian essay
tertulis diperkenalkan untuk menggantikan ujian lisan. Perkembangan berikutnya,
model ujian ini secara administratif menyulitkan karena meningkatnya jumlah
siswa dan dipandang tidak adil karena tidak bisa distandarisasi untuk seluruh
siswa. Suatu hal yang menarik dalam arti evaluasi program adalah adanya agen
kebijakan tersembunyi di samping gerakan ujian lisan; yaitu pengumpulan data
untuk melakukan perbandingan yang dapat digunakan dalam pengambilan keputusan
pada waktu pemilihan kepala sekolah. Howe dan Mann berupaya merekam hasil
sekolah yang berbeda-beda dan menggunakan data ini untuk menjinakkan
kepala-kepala sekolah yang menentang upaya mereka dalam menghapus hukuman
fisik. Ini adalah contoh politisasi data evaluasi.
Antara tahun 1887 dan 1898 Joseph Rice melaksanakan apa
yang umumnya dikenal dengan evaluasi formal yang pertama terhadap program
pendidikan di Amerika. Dia melaksanakan studi perbandingan nilai drill
pengajaran ‘spelling’ dan menemukan tidak terdapat perbedaan nilai yang berarti
antara sistem yang menggunakan waktu 200 menit pengajaran spelling dengan yang
hanya 10 menit per minggu. Hasil evaluasi Rice membuat pendidik mengkaji
kembali dan akhirnya merevisi metode mereka dalam mengajarkan spelling.
Kemajuan evaluasi program pendidikan nonformal ternyata
tidak sepesat evaluasi pendidikan formal. Program pendidikan nonformal yang
dilaksanakan oleh universitas-universitas di Amerika yang disajikan untuk
petani dan buruh-buruh tambang belum mendapat perhatian untuk dievaluasi secara
formal. Karena sifat program adalah nonformal dari sudut pandang universitas,
maka evaluasi formal belum mendapat perhatian. Begitu juga di Inggris,
program-program pendidikan nonformal belum dievaluasi seccara formal baik yang
dilaksanakan dengan label pendidikan baca tulis, university extension maupun
dengan label agriculture extension.
Dari uraian di atas dapat disimpulkan bahwa pada mulanya
evaluasi program pendidikan bersifat informal dan bertumpu pada kesan pelaksana
evaluasi. Evaluasi program pendidikan baru dilaksanakan secara formal setelah
menjelang akhir abad 19 dan menjadikan hasil belajar siswa sebagai aspek utama
evaluasi. Evaluasi program masa ini masih berfokus pada pendidikan formal.
Masa Efisiensi dan Testing
Masa efisiensi dan testing berlangsung sekitar tahun
1900 – 1930. Pada masa ini, gagasan
pengelolaan yang berlandaskan ilmiah menjadi pendorong teori administrasi di
bidang pendidikan dan industri. Penekanan gagasan ini terletak pada sistemik,
standarisasi dan yang terpenting adalah
efisiensi. Sesuatu program harus dievaluasi efisiensinya dan untuk ini tes
menjadi alat utama evaluasi.
Banyak survey yang dilaksanakan di sekolah-sekolah
berfokus pada efisiensi sekolah dan guru dan menggunakan bermacam-macam
kriteria seperti tingkat putus sekolah siswa dan rata-rata jumlah kenaikan
kelas. Pada tahun 1915 empat puluh sekolah di Amerika Serikat telah
melaksanakan atau sedang melakukan survey menyeluruh yang meliputi seluruh
tahap program pendidikan. Sejumlah survey menggunakan tes objektif dalam bidang
matematika, spelling, tulisan dan komposisi bahasa Inggris untuk menentukan
efisiensi pengajaran. Tes juga dikembangkan dan digunakan untuk mengukur
efisiensi program pendidikan di negara-negara bagian Amerika seperti yang
dikembangkan oleh Departemen Penelitian dan Pengukuran Pendidikan di Boston.
Prosentase kelulusan siswa berdasarkan hasil tes digunakan oleh guru untuk
membuat jastifikasi apakah sekolah mereka di bawah atau di atas rata-rata
standar untuk kota mereka. Berikutnya tes dikembangkan oleh para peneliti seperti
Courtis dan Ayers untuk mengukur secara tepat tujuan pengajaran.
Sejalan dengan pertumbuhan standarisasi tes achievement
setelah perang dunia kesatu, sekolah-sekolah negara bagian di Amerika
menggunakan tes untuk menentukan efektifitas peogram. Umpamanya, May menemukan
bahwa tes achivement yang tersedia secara komersil khusus yang dibuat oleh Biro
Penelitian Distrik, digunakan untuk mendiagnosa secara khusus kelemahan sistem
dan untuk mengevaluasi kurikulum dan performance keseluruhan sistim. Di samping
itu tes digunakan untuk membuat keputusan tentang individu. Universitas juga
tidak ketinggalan membentuk lembaga khusus untuk melakukan evaluasi yang
diperlukan oleh negara bagian. Institut-institut ini dapat dianggap sebagai
pendahuluan dari pusat-pusat di universitas yang berdedikasi dalam bidang
evaluasi yang tumbuh pada tahun 1960-an dan 70-a di negara maju dan pada tahun
1980-an di negara berkembang. Di Indonesia pada umunya evaluasi dilakukan oleh
pusat-pusat atau lembaga penelitian.
Pada awal masa ini (1900 – 1930), evaluasi seringkali
disalahgunakan. Seringkali beberapa
penduduk setempat mengundang pakar-pakar evaluasi untuk mengekpose
kelemahan-kelemahan lembaga-lembaga pendidikan dan pengembangan masyarakat dan
mengusulkan saran-saran perbaikan. Padahal evaluasi semestinya bukan hanya
untuk melihat kelemahan program saja. Di samping itu, hasil-hasil evaluasi yang
bersifat objektif dipergunakan sebagai propoganda untuk membendung meningkatnya
kritik masyarakat terhadap lembaga-lembaga pendidikan. Sangat disayangkan
evaluator pada saat ini tidak menyadari bahwa survey untuk melakukan evaluasi
dapat dan harus menghindari penyalahgunaan dan dilakukan untuk y hal yang
konstruktif, dikerjakan bekerja sama dengan advisor setempat dan dirancang
untuk menciptakan dukungan publik terhadap perubahan yang tidak dikenal tetapi
diperlukan.
Dari uraian di atas dapat ditarik kesimpulan bahwa
evaluasi lebih ditunjuk untuk melihat efisiensi suatu program dan tes dijadikan
alat utama evaluasi. Pendidikan formal menjadi perhatian utama pakar-pakar
evaluasi. Aspek program yang dievaluasi masih terbatas pada hasil belajar
(sebagian dari out put program). Evaluasi program-program pendidikan nonformal
masih belum mendapat perhatian pakar-pakar evaluasi.
Masa Tyler
Masa Tyler ini berlangsung sekitar tahun 1930 –
1945. Dinamakan masa Tyler, karena pada
masa itu pengaruh Tyler sangat besar dalam bidang evaluasi pendidikan khususnya
dalam bidang testing. Dia dianggap sebagai “nabinya” evaluasi. Dia bekerja
mulai dari mengkonsepsionalkan suatu pandangan inovatif dalam bidang kurikulum
dan evaluasi. Kurikulum ditempatkan sebagai satu set pengalaman sekolah yang
terencana secara luas. Dirangsang dan diterapkann untuk menolong siswa dalam
menguasai perilaku khusus. Istilah evaluasi pendidikan diartikan mengukur
seberapa jauh objektif program pengajaran telah dicapai. Kemudian kosep ini
pada tahun 1930-an digunakan oleh Tyler untuk menolong instruktur-instruktur di
negara bagian OHIO Amerika Serikat untuk meningkatkan kursus-kursus yang mereka
organisir dan tes yang dipergunakan mereka.
Pada saat ini Amerika Serikat mengalami krisis ekonomi.
Akibatnya lembaga-lembaga pendidikan dan lembaga-lembaga lainnya mengalami
kekurangan sumber-sumber non manusia dan tumbuhnya perasaan pesimis pada diri
pengelolanya. Pemerintah Amerika Serikat berupaya untuk mengatasi krisis
ekonomi dan pakar-pakar pendidikan (John Dewey dkk) melaksanakan pembaharuan
pendidikan untuk menopang upaya-upaya pemerintah. Pembaharuan dikenal dengan
istilah gerakan pendidikan progresif. Tyler ikut bergabung dengan gerakan ini
memimpin studi evaluasi terhadap pembaharuan yang dikenal dengan istilah ‘studi
delapan tahun’ yang disponsori oleh Carnegia Corporation.
Studi evaluasi yang dipimpin oleh Tyler adalah studi
yang terbesar dan pertama kali tentang perbedaan efektivitas bermacam-macam
tipe persekolahan. Masalah (pertanyaan)
evaluasi adalah kemanjuran (efficacy) program sekolah menengah tradisional
dibandingkan dengan sekolah menengah progresif. Hasil evaluasi mengakibatkan
lembaga-lembaga pendidikan tinggi menolak untuk menerima lulusan sekolah
menengah progresif karena tidak memiliki kredit untuk beberapa mata pelajaran
tertentu. Setelah dilaksanakan perdebatan cukup sengit, lebih jauh dari 300
lembaga pendidikan setuju melaksanakan eksperimen untuk membandingkan
performance mahasiswa di lembaga pendidikan tinggi yang berasal dari sekolah
menengah tradisional dan progresif.
Dampak dari studi delapan tahun antara lain adalah
pendidikan di Amerika Serikat mengenal istilah evaluasi yang pengertiannya
lebih luas daripada sebelumnya, yaitu pada masa efesiensi dan testing. Evaluasi
adalah perbandingan antara hasil yang diharapkan dan hasil aktual. Evaluasi
meliputi perbandingan antara hasil dengan objektif program dan tidak perlu harus menggunakan
design penelitian dengan biaya tinggi dan membagi menjadi kelompok eksperimen
dan kontrol. Aspek yang dievaluasi adalah hasil belajar bukan input pengajaran
dan organisasi sehingga tidak memerlukan jastifikasi dari evaluator profesional.
Karena pengukuran dilaksanakan atas dasar objektif program yang telah
didefinisikan secara operasional, maka tidak terlalu perlu memikirkan
reliabilitas perbedaan skor siswa/mahasiswa. Pada pertengahan tahun 1940
gagasan Tyler yang dituangkan dalam bentuk tulisan menjadi fondasi evaluasi
program pada umumnya. Sampai sekarang ini konsep ini Tyler dianut cukup luas
oleh evaluator dan telah dikembangkan sesuai dengan kebutuhan setempat.
Pada masa ini evaluasi untuk pendidikan nonformal sudah
mulai dikembangkan. Istilah fungsional literacy mulai dikenal pada waktu perang
dunia kedua. Tentara yang direkrut oleh Amerika Serikat dites kemampuan baca
tulis mereka yang diperlukan dalam melaksanakan tugas ketentaraan. Mereka yang
belum memiliki kemampuan baca tulis fungsional harus mengikuti training khusus
baca tulis.
Amerika, Inggris dan beberapa negara maju lainnya sudah
melaksanakan intensifikasi pertanian. Pekerja-pekerja extension dari departemen
pertanian diterjunkan untuk membantu petani mengikuti dan menerapkan
temuan-temuan baru yang berguna untuk membantu petani mengikuti dan menerapkan
temuan-temuan baru yang berguna untuk mereka. Evaluasi terhadap program-program
pengembangan masyarakat lebih banyak dilaksanakan dalam bentuk studi tentang
output, yaitu peningkatan hasil pertanian itu sendiri. Studi evaluasi ini
dilaksanakan bukan oleh evaluator, tetapi para peneliti dalam bidang pertanian.
Dari uraian di atas disimpulkan bahwa evaluasi program
pendidikan sudah meliputi program pendidikan nonformal, walaupun perhatian
utama evaluator masih pada pendidikan formal. Evaluasi terhadap program
pendidikan nonformal untuk pengembangan masyarakat sudah mulai dilaksanakan
oleh peneliti dalam bidang pertanian. Aspek program yang dievaluasi adalah
output program.
Masa Innocence
Masa ‘innocence’ ini berlangsung antara tahun 1946 –
1957 atau disebut juga tahun masa bodoh, khususnya di Amerika Serikat. Pada
masa ini keputusan, prasangka dan permusuhan sosial terjadi di daerah pedesaan
dan perkotaan. Tetapi tidak ada orang kulit putih yang memperhatikan keadaan
ini sebagai masalah sosial. Di samping itu, juga pola hidup konsumtif dan
penggunaan sumber-sumber seperti itu
suatu saat akan habis. Pada masa ini juga, pembangunan industri dan
militer secara besar-besaran
dilaksanakan tanpa memperhatikan konsekuensi-konsekuensi negatifnya.
Dalam bidang pendidikan, perluasan pemberian kesempatan
belajar, penambahan personal dan fasilitas dilaksanakan di Amerika Serikat dan
Inggris seccara besar-besaran. Pembangunan gedung-gedung baru dan
lembaga-lembaga pendidikan baru, lembaga-lembaga pendidikan membangun dan
menyajikan pelayanan kesehatan mental dan fisik, bimbingan dan penyuluhan,
pendidikan masyarakat dan program-program pendidikan nonformal seperti drama,
musik dan olah raga. Mahasiswa-mahasiswa baru yang mendaftar di perguruan
tinggi meningkat jumlahnya. Dengan cara ini masyarakat telah melupakan perang
yang baru saja selesai dan berupaya untuk meningkatkan kualitas dan kuantitas
hidup mereka.
Pembangunan dan peningkatan pendidikan mempunyai dampak
terhadap evaluasi program dan hasilnya. Pada masa ini pengembangan
teknik-teknik evaluasi telah tumbuh dengan pesat sejalan dengan perkembangan
dalam bidang teknologi. Dua macam design evaluasi telah berkembang dengan pesat
untuk eksperimen yang menggunakan kelompok kontrol dan design yang hanya
membandingkan antara hasil dan objektif. Penggunaan testing sebagai alat
evaluasi telah menyebar secara luas. Bahkan testing telah distandarisasi untuk
tingkat nasional di Amerika Serikat. Sekolah-sekolah memberi test yang sudah
distandarisasi bahkan disertai dengan mesin-mesin untuk memberikan skor dan
menganalisa hasil evaluasi.
Penerapan testing terstandar telah tersebar luas sekali.
Tidak hanya untuk Amerika tetapi juga negara-negara lainnya.
Organisasi-organisasi profesional telah menyusun dan mengembangkan bermacam tes
sesuai dengan keperluan. Tahun 1954 Panitia dari Assosiasi Ilmu Jiwa Amerika
menyiapkan rekomendasi untuk tes-tes kejiwaan dan teknik diagnostik. Tahun 1955
panitia-panitia dari AERA dan NCMUE menyiapkan rekomendasi teknis untuk tes
achievement. Dua laporan ini menjadi basis untuk ‘Standars for Educational and
Psychological Tests and Manuals’ pada tahun 1965 yang direvisi pada tahun 1974
dengan titel baru ‘Standars for Educational ad Psycological Tests’.
Lindquist mengembangkan lebih jauh lagi prinsip-prinsip
statistik design experimental untuk kepentingan untuk kepentingan evaluasi
program. Beberapa tahun kemudian banyak evaluator dan pendidik menghadapi
masalah dalam berusaha untuk memenuhi secara keseluruhan asumsi yang diperlukan
dalam design experiment seperti treatment yang berlaku secara konstan dan
subyek yang dipasangkan secara random. Di samping ini, pengembangan
teknik-teknik evaluasi atas dasar pandangan Tyler juga berkembang dengan pesat.
Penterapan gagasan Tyler memerlukan tujuan program yang dinyatakan secara
eksplisit. Hal ini memerlukan teknik-teknik yang dapat membantu para pendidik
untuk dapat merumuskan tujuan program pengajaran mereka secara eksplisit dengan
menggunakan taksonomi yang tepat.
Walaupun teknik evaluasi telah berkembang pesat, sedikit
sekali terdapat bukti bahwa evaluasi program telah dilaksanakan baik di
lembaga-lembaga pendidikan maupun pengembangan masyarakat. Walaupun sebagian program
ada yang dievaluasi,k pendidik-pendidik formal dan pengelola pendidikan
nonformal jarang menggunakan hasil evaluasi untuk perbaikan program. Anehnya,
masyarakat dan penyandang dana program tidak menuntut laporan
pertanggungjawaban pelaksanaan program dengan kata lain mereka acuh tak acuh.
Dari uraian di atas dapat disimpulkan bahwa
teknik-teknik evaluasi sudah semakin pesat perkembangannya, tetapi sedikit
sekali penerapannya di lapangan. Pelaksanaannya dan evaluasi dan penggunaannya
untuk peningkatan program jarang dilaksanakan karena masyarakat pada umumnya
dan penyandang dana pada khususnya memang tidak menuntut pertanggungjawaban
pelaksana program baik pendidik formal maupun nonformal yang ditujukan untuk
pengembangan masyarakat.
Masa Ekspansi
Masa ini berlangsung sekitar tahun 1958 – 1972. Di awal
masa ini Amerika Serikat mengalami kekagetan dengan kemampuan Uni Soviet yang
mampu meluncurkan Sputinik I tahun 1959. Seperti yang dikatakan Popham (1974)
Amerika termasuk bangsa yang ingin terbaik dalam segala hal. Karena itu mereka
perlu meninjau kembali sistem pendidikan yang menghasilkan tenaga-tenaga ahli
dan mengevaluasi mengapa sampai ketinggalan dengan Uni Soviet. Atas dasar ini
program matematika dan sains dimasukkan ke dalam kurikulum dan bahkan menjadi
kurikulum utama dengan harapan bukan hanya sekedar mengejar ketinggalan, tetapi
ingin melampaui Uni Soviet yang menjadi saingan utama mereka.
Dengan menggunakan model-model dan teknik evaluasi yang
sudah ada ternyata tidak menolong pengembang-pengembang kurikulum, program
pendidikan dan pengembangan masyarakat. Selain itu, hasil evaluasi bukan
sebagai respon terhadap pertanyaan-pertanyaan yang dikemukakan oleh orang-orang
yang ingin mengetahui efektifitas program. Para evaluator menyadari masalah ini
setelah mereka dengan dana yang cukup besar dan dengan cermat menerangkan
teknik evaluasi yang sudah ada pada saat itu dan menghasilkan sesuatu yang
tidak berguna untuk pengembangan kurikulum dan program-program lagi.
Cronbach menilai negatif pelaksanaan-pelaksanaan
evaluasi pada saat itu. Evaluasi dinilai kurang relevan dan kurang bermanfaat
dan menyarankan kepada evaluator untuk banting dari model-model dan teknik
evaluasi yang sudah ada. Cronbach mengemukakan gagasan tentang evaluasi yang
lebih komprehensif dari pada gagasan Tyler, yaitu pengumpulan dan pengunaan
informasi untuk pengambilan keputusan tentang progran pendidikan. Terdapat tiga
macam tipe keputusan menurut Cronbach : keputusan tentang perbaikan pendidikan,
tentang individu dan tentang peraturan administratif. Untuk membantu
pengambilan keputusan, evaluasi harus meliputi studi proses, pengukuran
kepandaian dan kecakapan, pengukuran sikap studi follow up. Perlu diperhatikan
performance siswa bukan satu-satunya kriteria untuk menentukan keberhasilan
program. Pandangan Cronbach menjadi pemula untuk model-model evaluasi yang
beriorentasi kepada ‘decision facilitation’ baik untuk program-program
pendidikan maupun pengembangan masyarakat.
Pada tahun 1956 amerika serikat memproklamirkan perang terhadap
kemiskinan. Program-program dengan biaya
trilyun dolar dimaksudkan untuk menyamakan dan meningkatkan kesempatan bagi
seluruh warga negara dalam bidang pelayanan pendidikan, sosial dan kesehatan.
Dana yang besar ini mungkin akan terbuang percuma bila pelaksana-pelaksana
program tidak diharuskan mempertanggungjawabkannya kepada pemberi dana. Senator
Robert Kennedy dkk. anggota konggres setuju untuk mengharuskan evaluasi khusus
dalam program ESEA. Sekolah-sekolah negara bagian yang menerima dana untuk
menyajikan program pendidikan pengganti atau pendidikan nonformal bagi
anak-anak tidak mampu diharuskan melaksanakan evaluasi tahunan untuk mengetahui
seberapa jauh tujuan program telah tercapai. Pada saat ini evaluator mulai
merubah titik berat mereka dari persoalan teori evaluasi ke pelaksanaan teori
itu sendiri di lapangan.
Dari pelaksanaan evaluasi sebagai persyaratan penerima
dana ternyata dapat diketahui dengan jelas bahwa teknik-teknik evaluasi yang
diterapkan tidak tepat digunakan dalam mengevaluasi program ESEA. Khususnya tes
standar yang telah dirancang untuk siswa yang berasal dari masyarakat kelas
menengah ke atas tidak cocok untuk siswa kurang mampu yang latar belakang
pendidikan mereka tertinggal di belakang siswa yang berasal dari kelas menengah
tersebut. Penggunaan tes standar bertentangan dengan konsep evaluasi Tyler. Tes
standar tidak menerima kemungkinan perbedaan antara daerah yang satu dengan
daerah yang lainnya, sedangkan Tyler membolehkan adanya perbedaan. Lebih jauh
lagi, hasil evaluasi tidak memberikan informasi tentang tingkat kebutuhan
anak-anak tidak mampu yang dapat digunakan oleh guru-guru dalam menyatakan
tujuan-tujuan program. Pada akhirnya, karena penggunaan design program dan alat
evaluasi yang tidak tepat maka hasilnya tidak mampu menunjukkan hasil program
secara tepat.
Setelah melihat hasil evaluasi yang berkenaan dengan
output program selalu negatif, Phi Delta Kappa membentuk suatu Komisi Studi
Evaluasi Nasional. Berdasarkan hasil survey, Komisi berkesimpulan bahwa evaluasi
program-program pendidikan mengalami sakit parah dan menghimbau pakar-pakar
evaluasi untuk mengembangkan teori-teori dan metode baru dan program-program
training baru untuk evaluator. Hasilnya, banyak konsep-konsep baru dikembangkan
untuk membenahi teori-teori evaluasi yang sudah kurang tepat. Reformasi
terhadap konsep-konsep Tyler dilakukan oleh Provus, Hamond, Eisner, Metfessel
dan Michael. Claser, Popham dan Tyler mengajukan ‘creterium referenced testing’
sebagai alternatif dari ‘norm referenced testing’. Scriven menyumbangkan konsep
‘goal-free’, Stufflebeam dan Alkin menyumbangkan konsep ‘decision
facilitation’, dan lain-lain. Scriven, Stufflebeam dan Alkin menyumbangkan
konsep yang berbeda dengan Tyler dan pendukung-pendukungnya. Evaluasi meliputi
output proses, input dan konteks dari program itu sendiri. Evaluasi output
termasuk evaluasi terhadap tujuan, hasil yang diharapkan dan tidak diharapkan.
Evaluasi program tidak hanya terbatas untuk pendidikan
formal, tetapi sudah mulai dikembangkan teori-teori evaluasi yang cocok untuk
pendidikan nonformal seperti yang dikembangkan oleh Paulo Freire dan Meziro W.
Untuk evaluasi program pendidikan nonformal banyak dikembangkan teori-teori
partisipator yang berasal dari penelitian partisipatori dan evaluasi demokratis
yang semula diterapkan untuk pendidikan formal. Lebih jauh lagi, teori-teori
evaluasi dikembangkan dengan pesat tidak hanya di Amerika Serikat tetapi juga
di Inggris seperti illmuminative evaluation yang dikembangkan oleh Parlett dan
Hamilton.
Dari uraian di atas dapat ditarik kesimpulan bahwa
pengembangan teori dan teknik evaluasi sejalan dengan penerapan di lapangan.
Bermacam-macam model evaluasi program yang berbeda-beda, baik di bidang
pendidikan formal maupun nonformal. Aspek-aspek program yang dievaluasi tidak
hanya terbatas pada output program saja, tetapi meliputi konteks, input dan
prosesnya.
Masa Profesionalisasi
Masa profesionalisasi berlangsung mulai tahun 1973
sampai sekarang ini. Evaluasi sudah tumbuh menjadi profesi tersendiri yang tidak
sama dengan penelitian dan testing. Walaupun teknik pengumpulan data dan
penentuan sampel mungkin saja penelitian tetapi tingkat generalisasinya tidak
sejauh penelitian, khususnya dalam hal waktu dan instansinya. Dalam evaluasi
program, tes mungkin digunakan, tetapi penggunaannya hanya sebagai bagian dari
evaluasi yang lazim disebut dengan istilah produk. berikut ini akan
didiskusikan perkembangan profesionalisasi evaluasi program pendidikan dan
pengembangan masyarakat.
Pada mulanya evaluator merasakan adanya krisis
identitas. Mereka tidak yakin apakah mereka harus masuk kubu peneliti, tester
atau administrator dan kualifikasi apa yang harus dimiliki. Tidak banyak
majalah evaluasi program yang dapat digunakan oleh evaluator untuk bertukar
hasil evaluasi dan gagasan. Belum ada organisasi profesional yang berdedikasi
terhadap evaluasi sebagai disiplin tersendiri. Pada dasarnya belum ada buku
literatur evaluasi program kecuali sekedar masalah yang tidak diterbitkan.
Lebih buruk lagi, evaluasi banyak dilaksanakan oleh orang-orang yang bukan
dipersiapkan untuk itu (amatiran). Untuk mengatasi krisis ini, evaluasi program
perlu diprofesionalisasikan. Majalah-majalah diterbitkan seperti Educational
Evaluation and Policy Analysis, Hindies in Evaluation, CEDR Quarterly,
Evaluation Review, New Direction for Program Evaluation dan lain-lain.
Majalah-majalah ini menjadi alat efektif untuk merekam dan menyebarluaskan
informasi tentang evaluasi program.
Banyak universitas dan institut mulai memberikan minimal
satu matakuliah metodologi evaluasi. Dalam hal ini termasuk jurusan Pendidikan
Luar Sekolah (Negeri IKIP Malang). Lebih jauh lagi beberapa universitas membuka
program Pasca Sarjana dalam bidang evaluasi seperti University of Illinois,
Stanford University, Boston College UCLA dan University of Mimmosata. Nova
University mungkin yang termasuk pertama menyajikan matakuliah evaluasi di
tingkat doktoral. Departemen pendidikan Amerika Serikat telah mensponsori
program-program training untuk evaluasi dan organisasi-organisasi profesional
telah menyajikan program-program lokakarya evaluasi. Pusat-pusat studi evaluasi
telah didirikan dan dikembangkan di negara-negara maju dan berkembang. Sejalan
dengan pesatnya program pembangunan ini negara berkembang termasuk diantaranya
bidang pendidikan dan pengembangan masyarakat, evaluasi perlu dilaksanakan oleh
kelompok-kelompok profesional. Umpamanya, evaluasi program kerjasama RI –
UNICEF di bidang PLS diserahkan kepada Pusat Penelitian IKIP Malang. Contoh
lain, banyak evaluasi program yang diperlukan oleh BAPPEDA Jawa Timur
diserahkan kepada evaluator-evaluator dari universitas dan institut dan lembaga
profesional lainnya. Sejalan dengan profesionalisasi evaluasi, disiplin ini
memerlukan cara untuk menilai dan menentukan kualitas evaluasi. Untuk ini meta
evaluasi dipandang sebagai salah satu
cara yang tepat.
Pada masa
ini pada evaluator menyadari bahwa teknik-teknik evaluasi yang harus membuahkan
hasil yang memadai ditinjau dari sudut metodologi penelitian, dapat menyajikan
informasi yang dibutuhkan oleh klien, mengangkat isu-isu sentral, terkait
dengan realitas situasi, memenuhi persyaratan kejujuran dan ketelitian.
Teknik-teknik yang memenuhi persyaratan ini sedang dikembangkan seperti
goal-free, adversary, meta analysis, responsive evaluation dan naturalistic
evaluation. Webster dan kawan-kawan telah mengoperasionalkan konsep CIPP
Stuffelebeam untuk diterapkan dalam ruang lingkup sekolah. Bhola telah
mengembangkan nation ideology approach untuk membuat model evaluasi yang tepat
untuk masing-masing negara yang berbeda ideologinya. Stake telah mengadopsi
model studi kasus untuk diterapkan dalam evaluasi program khususnya untuk
pendidikan yang berlangsung di luar sistem persekolahan dan untuk
program-program pengembangan masyarakat. Banyak lagi pakar evaluasi, selain
yang disebutkan di sini, mengembangkan teknik evaluasi yang dapat memenuhi
persyaratan yang telah ditetapkan di atas.
Profesionalisasi
evaluasi telah melahirkan hasil campuran seperti yang dikemukakan oleh Madaus
(1983). Pertama, tidak diragukan adanya komunikasi yang lebih baik dan intensif
dalam bidang evaluasi, di samping juga menimbulkan banyak gunjingan. Kedua,
pada waktu terjadi peningkatan training dan kewenangan evaluator untuk
meyakinkan bahwa lembaga-lembaga pemesan mendapat pelayanan dari orang-orang
yang qualified, beberapa pengamat cemas bahwa pengembangan ini akan menimbulkan
klub yang ekslusif dan berpandangan sempit. Ketiga, kerjasama di antara
organisasi-organisasi profesional yang bergerak dalam bidang evaluasi program
pendidikan adalah suatu hal yang positif, tetapi juga gampang buyar, untuk
mempromosikan dan melaksanakan kerja evaluasi yang berkualitas tinggi. Keempat,
pembentukan organisasi-organisasi profesional baru telah meningkatkan
komunikasi antar evaluator dan mengurangi fragmentasi dalam bidang evaluasi.
Pada sisi lain masih terdapat perbedaan yang tajam antara Divisi H dari AERA,
Jaringan Kerja Evaluasi dan Masyarakat Reseach Amerika. Khusus untuk persoalan
pertama sampai ketiga tidak hanya terjadi di Amerika, tetapi merupakan
persoalan dunia.
Masalah lain yang mendasar adalah perbedaan antara
pendekatan kualitatif dan kuantitatif dalam evaluasi program. Perbedaan bukan
hanya sekedar teknik, tetapi landasan filosifis. Kualitatif berangkat dari
subjectivitist epistemology yang menempatkan kebenaran tidak terlepas dari
kontek dan pengetahuan adalah persepsi dan pemahaman individu terhadap realita.
Kuantitatif berangka dari objectivist epistemology yang menempatkan kebenaran
terlepas dari kontek. Karena itu pengetahuan adalah realita yang terlepas dari
persepsi individu. Evaluator yang kurang awas seringkali menggabungkan dua
teknik dari pendekatan yang berbeda ini dan akhirnya mungkin akan membuahkan
hasil evaluasi yang menyesatkan.
Dari uraian di atas dapat disimpulkan bahwa evaluasi
telah mampu untuk menjadi profesi tersendiri. Banyaknya teknik-teknik,
metode-metode dan pendekatan evaluasi mengharuskan evaluator untuk memilih
salah satu atau mungkin mengembangkan teknik atau metode baru yang sesuai
dengan kontek di mana evaluasi dilaksanakan.
Tidak ada komentar:
Posting Komentar