Terdapat beberapa istilah yang sering disalahartikan dalam kegiatan evaluasi, yaitu evaluasi (evaluation), penilaian (assessment), pengukuran (measurement), dan tes (test). Dalam UU No.20/2003 tentang Sistem Pendidikan Nasional Bab I Pasal 1 ayat 21 dijelaskan bahwa “evaluasi pendidikan adalah kegiatan pengendalian, penjaminan, dan penetapan mutu pendidikan terhadap berbagai komponen pendidikan pada setiap jalur, jenjang, dan jenis pendidikan sebagai bentuk pertanggungjawaban penyelenggaraan pendidikan”. Selanjutnya, dalam PP.19/2005 tentang Standar Nasional Pendidikan Bab I pasal 1 ayat 17 dikemukakan bahwa “penilaian adalah proses pengumpulan dan pengolahan informasi untuk mengukur pencapaian hasil belajar peserta didik”. Sehubungan dengan kedua istilah tersebut di atas, Ditjen Dikdasmen Depdiknas (2003 : 1) secara eksplisit mengemukakan bahwa antara evaluasi dan penilaian mempunyai persamaan dan perbedaan.
Persamaannya adalah keduanya mempunyai pengertian menilai atau menentukan nilai sesuatu. Adapun perbedaannya terletak pada konteks penggunaannya. Penilaian (assessment) digunakan dalam konteks yang lebih sempit dan biasanya dilaksanakan secara internal, yakni oleh orang-orang yang menjadi bagian atau terlibat dalam sistem yang bersangkutan, seperti guru menilai hasil belajar murid, atau supervisor menilai guru. Baik guru maupun supervisor adalah orang-orang yang menjadi bagian dari system pendidikan. Adapun evaluasi digunakan dalam konteks yang lebih luas dan biasanya dilaksanakan secara eksternal, seperti konsultan yang disewa untuk mengevaluasi suatu program, baik pada level terbatas maupun pada level yang luas.
Istilah pengukuran (measurement) mengandung arti “the act or process of ascertaining the extent or quantity of something” (Wand and Brown, 1957 : 1). Hopkins dan Antes (1990) mengartikan pengukuran sebagai “suatu proses yang menghasilkan gambaran berupa angka-angka berdasarkan hasil pengamatan mengenai beberapa ciri (atribute) tentang suatu objek, orang atau peristiwa”. Dengan demikian, evaluasi dan penilaian berkenaan dengan kualitas daripada sesuatu, sedangkan pengukuran berkenaan dengan kuantitas (yang menunjukkan angkaangka) daripada sesuatu. Oleh karena itu, dalam proses pengukuran diperlukan alat ukur yang standar. Misalnya, bila ingin mengukur IQ diperlukan alat ukur yang disebut dengan tes, bila ingin mengukur suhu badan diperlukan alat yang disebut dengan termometer, dan sebagainya.
Istilah lain yang banyak digunakan dalam penilaian dan pengukuran adalah tes. Berdasarkan contoh di atas, dapat disimpulkan bahwa tes adalah alat atau cara yang sistematis untuk mengukur suatu sampel perilaku. Sebagai suatu alat ukur, maka di dalam tes terdapat berbagai item atau serangkaian tugas yang harus dikerjakan atau dijawab oleh peserta didik. Tes yang baik adalah tes yang memenuhi persyaratan validitas (ketepatan/kesahihan) dan reliabilitas (ketetapan/keajegan).