การวัดผลการศึกษาซึ่งถือว่าเป็นการวัดทางด้านสังคมศาสตร์ มีลักษณะเป็นนามธรรม อีกทั้งเครื่องมือที่ใช้จะต้องสร้างขึ้นอย่างมีคุณภาพ ถึงแม้ว่าขณะนี้การวัดผลจะพยายามใช้วิธีการ ทางวิทยาศาสตร์เป็นหลักดำเนินการก็ตาม แต่ในทางปฏิบัติจริงการวัดคุณลักษณะบางอย่างก็มีขีดจำกัดไม่อาจกระทำอย่างได้ผลเต็มที่ มักมีความคลาดเคลื่อนในการวัดเกิดขึ้นทุกครั้งไป ทั้งนี้เพราะสาเหตุสำคัญ 3 ประการ คือ
1. ไม่สามารถกำหนดลักษณะหรือความหมายของสิ่งที่จะวัดได้อย่างชัดเจน
2. พฤติกรรมการเรียนรู้บางชนิดที่ต้องการให้เกิดแก่ผู้เรียนนั้นจะเกิดขึ้นอย่างสมบูรณ์ได้ต้องอาศัยการผสมผสานพฤติกรรมย่อย ๆ หลายๆ ชนิด
3. พฤติกรรมการเรียนรู้บางอย่างของผู้เรียนบางครั้งไม่อาจเกิดขึ้นในสภาวะหรือในระยะของการเรียน
ปัญหาต่าง ๆ เหล่านี้ มีแนวทางในการแก้ไขได้หลายด้านหลายแบบ แนวทางหนึ่งที่สำคัญก็คือความพยายามในการหาวิธีการสอบวัดที่เหมาะสมกับคุณลักษณะที่จะวัดและสภาพทั่ว ๆ ไป โดยปกติการสอบวัดหรือลักษณะของการวัดผลการศึกษานั้นมีอยู่ 2 ลักษณะใหญ่ ๆ คือ
1. การวัดพฤติกรรมตรง (Direct Measured)
การวัดพฤติกรรมตรงเป็นการวัดที่มุ่งหาคุณสมบัติ หรือจำนวน ปริมาณ พฤติกรรมของ ผู้เรียนจากการแสดงออกจริง ๆ ให้สามารถสังเกตหรือเห็นได้ การวัดลักษณะนี้ดีเลิศและถูกต้องที่สุด ซึ่งมี 2 แบบ คือ
1) การวัดจากการกระทำจริง เป็นการวัดที่ใช้สถานการณ์จริงหรือเหตุการณ์ในชีวิตประจำ
วันเป็นเครื่องเร้า เพื่อให้ผู้สอบแสดงพฤติกรรมต่าง ๆ ออกมาด้วยการปฏิบัติหรือแก้ปัญหาจริง ๆ เช่น
1) ต้องการทราบว่าเด็กซ่อมไฟฟ้าในบ้านได้หรือไม่ ก็ให้ลงมือซ่อมไฟฟ้าจริง
2) ต้องการวัดความสามารถเกี่ยวการปฐมพยาบาลคนเป็นลมแดด ก็ใช้การสมมุติว่าเด็กคนหนึ่งเป็นลมแดดแล้วให้แสดงการปฐมพยาบาล
2) การวัดจากการสร้างหุ่นจำลอง เป็นการสร้างแบบหรือสร้างสถานการณ์ขึ้นแทนสถานการณ์จริง ๆ เป็นการสมมุติเหตุการณ์ในชีวิตประจำวันขึ้นแล้วให้ผู้เรียนปฏิบัติกับหุ่นจำลองที่สร้างขึ้น
การวัดพฤติกรรมตรงไม่ว่าจะวัดจากการกระทำจริงหรือจากการสร้างหุ่นจำลองที่สมมุติขึ้น ก็ตามเป็นวิธีที่ต้องใช้เวลาและแรงงานค่อนข้างมากจนไม่สามารถวัดได้ทั่วถึง เพราะส่วนใหญ่ต้องวัดเป็นรายบุคคล ในบางกรณีพฤติกรรมบางชนิดที่ต้องการวัดนั้นไม่มีโอกาสเกิดจริงได้ หรือแม้แต่ จะจำลองขึ้นก็ลำบากยุ่งยากมากเช่นเหตุการณ์ทางประวัติศาสตร์ แผ่นดินไหว ภูเขาไฟระเบิด
2. การวัดพฤติกรรมทางอ้อม (Indirect Measured)การวัดพฤติกรรมทางอ้อมเป็นการวัดพฤติกรรมหรือความสามารถที่ต้องใช้ในสถานการณ์จริงโดยผ่านตัวกลางอื่นซึ่งสัมพันธ์กับของจริง คุณภาพการวัดด้วยวิธีนี้จึงอยู่ที่ความเชื่อถือได้ของ ตัวกลางที่กำหนดขึ้น ถ้าเป็นเรื่องราวที่ต้องใช้ความสามารถเหมือนของจริงผลที่ได้ก็มีโอกาสถูกต้อง ตัวกลางในที่นี้ก็คือ เรื่องราว สถานการณ์ หรือปัญหาที่กำหนดขึ้นมาเพื่อให้เด็กแสดงพฤติกรรม ออกมาโดยไม่ต้องกระทำจริง แต่ใช้วิธีการตอบด้วยการเขียนแทน ซึ่งก็คือการใช้ข้อสอบแบบข้อเขียนนั่นเอง วิธีนี้กระทำได้ 3 แบบ คือ
1) การวัดพฤติกรรม สัมพันธ์เป็นการวัดพฤติกรรมต่าง ๆ ที่เกี่ยวข้องกับการที่จะใช้ในการปฏิบัติจริง เช่น การวัดความสามารถในการเขียนเรียงความแทนที่จะให้เขียนเรียงความจริงๆ ก็ใช้วิธีวัดความสามารถในด้านคำศัพท์ การจัดเรียงลำดับข้อความ การใช้ภาษาแทน โดยยอมรับว่าสิ่งที่วัดเหล่านั้นเมื่อรวมกันแล้วจะแทนของจริง หรือมีค่าเท่าเทียมหรือสัมพันธ์กับการปฏิบัติจริง ความถูกต้องของการวัดแบบนี้ย่อมขึ้นกับการกำหนดพฤติกรรมที่จะวัดว่ามีความสัมพันธ์กับของจริงจนทดแทนกันได้หรือไม่
2) การวัดสถานการณ์ เป็นการลดคุณภาพการวัดลงมาอีกขั้นหนึ่งด้วยการกำหนดหรือสร้างสถานการณ์ หรือเหตุการณ์ที่คล้ายคลึงกับของจริงนำมาให้เด็กพิจารณาตัดสินใจเพื่อตอบปัญหาที่เกี่ยวข้องกับสถานการณ์นั้น สิ่งที่นำมาเป็นสถานการณ์อาจเป็นเหตุการณ์สมมุติ เป็นเรื่องราว ข้อความ แผนที่ แผนผัง บทประพันธ์ หรือตารางตัวเลขใด ๆ ก็ได้ แล้วตั้งคำถามเพื่อถามรายละเอียดหรือถามความคิดในแง่มุมต่าง ๆ ของสถานการณ์ที่กำหนดขึ้นนั้น ซึ่งถ้าใครตอบในลักษณะใดก็คาดคะเนว่าผู้นั้นจะไปเผชิญของจริงได้ในลักษณะนี้เช่นกัน
3) การวัดความรู้ การวัดแบบนี้เป็นการวัดความสามารถในการจดจำรายละเอียด ต่าง ๆ ของเนื้อหาวิชาหรือเป็นการวัดพฤติกรรมด้านความจำซึ่งเป็นการวัดความลักษณะสามารถขั้นพื้นฐานที่มีคุณภาพด้อยกว่าการวัดแบบอื่น ๆ ที่กล่าวมา การวัดแบบนี้ยังแพร่หลายมาก เพราะวัดได้ง่ายและสะดวกในเชิงปฏิบัติ แต่ผลที่ได้จากการวัดจะเป็นเพียงพฤติกรรมด้านความทรงจำเท่านั้น ซึ่งเป็นการไม่เหมาะสมนัก เพราะ เนื้อหาวิชาต่าง ๆ ที่กำหนดขึ้นในหลักสูตรไม่ได้ปราถนาจะปลูกฝังเฉพาะพฤติกรรมความสามารถด้านความจำของผู้เรียนแต่เพียงอย่างเดียวเท่านั้น
การวัดผลที่กล่าวมาแต่ละแบบไม่มีแบบใดที่ดีเลิศ ต่างก็มีทั้งข้อดีและข้อเสียทั้งสิ้น การจะเลือกใช้การวัดแบบใดย่อมขึ้นกับโอกาสและความเหมาะสมโดยต้องพยายามขจัดข้อเสียต่าง ๆ ให้เหลือน้อยที่สุด แต่ถึงอย่างไรก็ตามไม่ว่าจะเป็นการวัดแบบไหนก็ย่อมมีความผิดพลาดคลาดเคลื่อนขึ้นเสมอ ดังนั้นจึงต้องใช้ความพยายามขจัดความคลาดเคลื่อนเหล่านั้นให้น้อยที่สุด