การวัดผล  การประเมินผล  และการสอบ  เป็นคำที่เกี่ยวข้องกัน  และมักเรียกรวมกันว่า การสอบวัดผล  การวัดผลประเมินผล   ซึ่งเป็นคำรวมกันคำละ  2 คำ  และมีคำซ้ำกันหนึ่งคำ  รวมมีคำที่เกี่ยวข้องทั้งหมด 3 คำ   คือ คำว่า  การวัดผล (Measurement)   คำว่าการสอบ (Testing)  และคำว่า การประเมินผล (Evaluation) เป็นคำที่มีความหมายแตกต่างกัน  แต่มักจะใช้ควบคู่กันเสมอ  เพื่อให้มีความเข้าใจได้ชัดเจนและถูกต้อง ของคำดังกล่าว  ได้มีผู้ให้ความหมายไว้ดังนี้

            ความหมายของคำว่า  การวัดผล 
การวัดผลเป็นการกำหนดจำนวนหรือปริมาณให้แก่สิ่งที่วัดโดยมีเงื่อนไขหรือกฎเกณฑ์  การวัดผลแบ่งออกเป็น 2 ประเภท คือ
           1. การวัดทางกายภาพศาสตร์ (Physical  Science) เป็นการวัดเพื่อหาจำนวน  ปริมาณของสิ่งต่าง ๆ ที่เป็นรูปธรรม  มีตัวตนแน่นอน  เช่น  ความยาว  น้ำหนัก  พื้นที่  ปริมาตร  ขนาด  ส่วนใหญ่เป็นการวัดวัตถุ  สิ่งของ  การวัดทางด้านนี้มักเป็นรูปธรรม  มีเครื่องมือวัดที่ให้ผลเชื่อถือได้  มีหน่วยการวัดแน่นอน  เช่น  เป็นเมตร  เป็นกรัม  ซึ่งทำให้การวัดทางกายภาพศาสตร์ได้ผลการวัดที่ถูกต้องแม่นยำ
           2. การวัดทางสังคมศาสตร์ (Social  Science) เป็นการวัดเพื่อหาจำนวนหรือคุณภาพของสิ่งที่เป็นนามธรรม  ไม่มีตัวตนแน่นอน  ส่วนใหญ่เกี่ยวข้องกับพฤติกรรมของสิ่งมีชีวิตทั้งหลาย  เครื่องมือที่ใช้วัดมักขาดคุณภาพให้ผลเชื่อถือได้ต่ำ  เช่น  การวัดความรู้  การวัดการปรับตัวของ  นักเรียน  การวัดผลการศึกษาเป็นส่วนหนึ่งของการวัดทางด้านสังคมศาสตร์  ซึ่งในปัจจุบันนี้     การวัดทางด้านนี้พยายามปรับปรุงวิธีการโดยอาศัยวิธีการทางวิทยาศาสตร์เป็นรากฐานเพื่อให้ได้         ผลการวัดที่แน่นอน  ถูกต้องมากขึ้น
การวัดทั้งสองประเภท  เป็นการใช้ความพยายามที่จะกำหนดตัวเลขหรือสัญลักษณ์เพื่อใช้แทนปริมาณหรือคุณภาพของพฤติกรรมความสามารถของบุคคล  ผลการวัดที่ได้แต่ละครั้งจะแตกต่างกัน  มิได้มีลักษณะหรือคุณภาพเหมือนกันทุกครั้งไป  ทั้งนี้ย่อมขึ้นกับวัตถุประสงค์ของการวัด  เครื่องมือที่ใช้วัด  รวมทั้งวิธีการวัดที่จะทำให้ผลการวัดมีลักษณะอย่างไรละเอียดหรือหยาบเพียงใด  ซึ่งการวัดสามารถจำแนกระดับของความละเอียดได้ 4 ระดับ ดังนี้
            ระดับที่ มาตรานามบัญญัติ (Nominal  Scale) เป็นการกำหนดชื่อให้กับเรื่องราวหรือสิ่งของต่าง ๆ เช่น  เพศชาย  เพศหญิง  ชั้นประถมศึกษา  อาชีพรับราชการ  ชาวนา  ชาวสวน  เป็นต้น มาตราวัดระดับนี้เป็นเพียงแต่การจัดหมวดหมู่สิ่งที่มีลักษณะเดียวกันเข้าเป็นประเภทเดียวกันเท่านั้น  ซึ่งนับว่าเป็นมาตราการวัดที่หยาบที่สุด
            ระดับที่ มาตราการจัดอันดับ (Ordinal  Scale) เป็นการจัดเรียงลำดับของสิ่งที่อยู่ ในหมวดหรือสกุลเดียวกัน  ให้ลดหลั่นตามลำดับปริมาณหรือคุณภาพ  เช่น  เก่ง  ค่อนข้างเก่ง  กลาง  หรือการจัดอันดับที่ 1  2  3  เป็นต้น  ซึ่งการจัดอันดับในมาตรานี้เป็นเพียงการบอกปริมาณและคุณภาพที่มีมากน้อยต่างกันเท่านั้น  แต่ไม่สามารถบอกได้ว่าแต่ละอันดับนั้นแตกต่างกันมากน้อยเพียงไร  และแต่ละชั้นนั้นห่างเท่ากันหรือไม่
            ระดับที่ 3 มาตราอันตรภาค (Interval  Scale) การกำหนดตัวเลขการวัดในระดับนี้  เป็นการแบ่งของที่อยู่ในลักษณะเดียวกันออกเป็นประเภทหรือช่วงที่เท่า ๆ กัน  เช่น 1 ชั่วโมงมี 30  นาที    1 วันมี 24 ชั่วโมง  ซึ่งการแบ่งเป็นช่วงเท่า ๆ กัน  ในลักษณะนี้ทำให้ข้อมูลที่ได้จากการวัดมีความหมายยิ่งขึ้น  เพราะสามารถนำผลที่ได้ไปเปรียบเทียบ  บวก  ลบ  กันได้  แต่มาตราการวัดระดับนี้ยังมีจุดอ่อนอยู่ตรงที่  ศูนย์ที่ได้จากการวัดในมาตรานี้ยังไม่ใช่ศูนย์แท้ (Absolute  Zero) แต่เป็นเพียงศูนย์สมมุติเท่านั้น  เพราะศูนย์ในมาตราการวัดชนิดนี้มิได้หมายความว่าไม่มีอะไรเลย  แต่เป็นการสมมุติว่าไม่มี  แท้จริงยังมีลักษณะที่วัดนั้นอยู่บ้าง 
            ระดับที่ 4 มาตราอัตราส่วน  (Ratio  Scale) เป็นมาตราการวัดที่สมบูรณ์  คุณสมบัติของการกำหนดตัวเลขในมาตราการวัดนี้คือ  มีศูนย์แท้และมีช่วงที่เท่ากัน  เรียงขึ้นลงตามลำดับสม่ำเสมอ  เช่น  การวัดความยาวของสิ่งของ  ความยาวเท่ากับศูนย์หมายความว่าไม่มีความยาว  น้ำหนักศูนย์แสดงว่าไม่มีน้ำหนักสิ่งของที่มี  น้ำหนัก 10 กิโลกรัม  แสดงว่าน้ำหนักเป็น  2 เท่าของสิ่งของ 5  กิโลกรัม  เป็นต้น

            ความหมายของคำว่า  การประเมินผล  
            การประเมินผลเป็นกระบวนการที่ทำต่อเนื่องจากการวัดผลแล้ววินิจฉัย  ตัดสิน  ลงสรุป  เพื่อพิจารณาความเหมาะสมหรือหาคุณค่าของคุณลักษณะและพฤติกรรมอย่างมีกฎเกณฑ์และมีคุณธรรม  ซึ่งในการประเมินผลจะต้องมีองค์ประกอบหลัก 3 ประการ  คือ
1. การวัดผล (Measurement) ทำให้ทราบสภาพความจริงของสิ่งที่จะประเมินว่ามีปริมาณเท่าไร  มีคุณสมบัติอย่างไร  เพื่อใช้เป็นข้อมูลสำหรับนำไปเปรียบเทียบกับเกณฑ์
            2. เกณฑ์การพิจารณา (Criteria) ในการที่จะตัดสินว่าสิ่งใดดี เลว ใช้ได้ หรือใช้ไม่ได้นั้น  จะต้องมีหลักเกณฑ์หรือมีบรรทัดฐานที่ต้องการ  โดยนำผลการวัดนั้นมาเปรียบเทียบกับเกณฑ์ที่กำหนดไว้  หรือมาตรฐานที่ต้องการ  เกณฑ์การพิจารณาในการประเมินผลการศึกษานั้นก็คือจุดมุ่งหมายของการศึกษานั่นเอง
            3. การตัดสินใจ (Decision) เป็นการชี้ขาดหรือสรุปผลที่ได้จากการวัดเทียบกับเกณฑ์การเปรียบเทียบระหว่างผลการปฏิบัติ  ซึ่งได้จากการวัดกับเกณฑ์ที่กำหนดไว้ว่าสูงต่ำกว่ากันขนาดไหน  ทั้งนี้การตัดสินใจที่ดีต้องอาศัยการพิจารณาอย่างถี่ถ้วนทุกแง่มุม  และกระทำอย่างยุติธรรมโดยอาศัยสภาพและความเหมาะสมต่าง ๆ ประกอบ  หรือต้องมีคุณธรรม
            จากความหมายของการวัดผล  และการประเมินผล  แสดงว่ากระบวนการทั้งสองต่อเนื่องกันไป  กล่าวคือ  เมื่อมีการวัดผลแล้วจะได้รายละเอียดหลายด้าน  แล้วนำผลทั้งหลาย       มาพิจารณา  หรือที่เรียกว่าประเมินผล  ผลการประเมินจะถูกต้องเหมาะสมเพียงใดย่อมขึ้นกับ       ผลของการวัดเป็นประการสำคัญ  ทั้งการวัดผล  และการประเมินผล  จึงสัมพันธ์เกี่ยวโยงกัน      แต่อย่างไรก็ตามการวัดผล  และการประเมินผลยังมีลักษณะรายละเอียดที่แตกต่างกัน  ซึ่งพอจะเปรียบเทียบได้ดังนี้

การวัดผล

การประเมินผล

  1. เป็นการกำหนดจำนวน  ปริมาณ  หรือ   รายละเอียด
  2. กระทำอย่างละเอียดทีละด้านทีละอย่าง
  3. ใช้เครื่องมือเป็นหลัก
  4. ผลที่ได้เป็นข้อมูลรายละเอียด
  5. อาศัยวิธีการทางวิทยาศาสตร์
  1. เป็นการกำหนดระดับของคุณค่า หรือตัดสินลงสรุปผล
  2. สรุปผลเป็นข้อชี้ขาด
  3. ใช้ผลการวัดเป็นหลัก
  4. ผลที่ได้เป็นการตัดสินใจ
  5. อาศัยการใช้ดุลพินิจ

            ความหมายของคำว่า  การสอบ 
            การสอบ  หรือการทดสอบ  เป็นการกำหนดจำนวน ปริมาณ หรือคุณลักษณะของพฤติกรรมหรือความสามารถของบุคคลโดยใช้ข้อสอบเป็นเครื่องมือ  หรือเป็นสิ่งเร้า  ดังนั้น       การสอบหรือการทดสอบก็คือ  การวัดผลการศึกษาอย่างหนึ่งซึ่งใช้ข้อสอบทำหน้าที่เป็นเครื่องมือวัดความสามารถของบุคคล  ซึ่งจัดว่าเป็นวิธีการที่ใช้กันมาก  และแพร่หลายที่สุด  ทุกครั้งที่มี      การสอบ  จนในบางครั้งสามารถใช้คำว่าการสอบแทนการวัดผลการศึกษา  ซึ่งในการสอบจะมีองค์ประกอบ 4 ประการ  คือ
           1.  บุคคล  ซึ่งถูกวัดคุณลักษณะความสามารถ
           2.  ข้อสอบ  ซึ่งทำหน้าที่เป็นสิ่งเร้า
           3.  การดำเนินการสอบ  ซึ่งจะต้องกระทำให้เกิดความยุติธรรมแก่ผู้เข้าสอบอย่างเสมอหน้ากันทุกคน  หลีกเลี่ยงการรบกวนของผู้คุมสอบในขณะที่ผู้สอบกำลังใช้ความคิด
          4.  ผลการสอบ  ซึ่งแทนความสามารถสูงสุดของแต่ละบุคคล