คะแนนที่ได้จากการตรวจคำตอบ ผลงานของผู้เรียน หรือการสังเกตผลการปฏิบัติ คะแนนเหล่านี้เราเรียกว่าคะแนนดิบซึ่งคะแนนดิบเป็นเพียงสิ่งที่บอกว่าผู้เรียนทำข้อสอบได้ มากน้อยเพียงใด ไม่สามารถบอกว่านักเรียนแต่ละคนเก่ง อ่อนเท่าใด นักเรียนที่ทำคะแนนได้ 50 คะแนน จากคะแนนเต็ม 100 คะแนน ไม่ได้บอกว่านักเรียนมีความเก่งปานกลาง เพราะทำข้อสอบได้ครึ่งหนึ่งของคะแนนเต็ม ทั้งนี้ขึ้นอยู่กับความยาก – ง่ายของข้อสอบ
ดังนั้นจะเห็นได้ว่า คะแนนดิบไม่มีความหมายเพียงพอที่จะนำมาเปรียบเทียบกันได้ เนื่องจากคะแนนดิบมีความไม่เหมาะสมหลายประการ คือ
1. หน่วยของคะแนนที่ใช้วัดไม่สมบูรณ์ ไม่มีความหมาย เปรียบเทียบไม่ได้
2. คะแนนดิบไม่มีความคงที่
3. คะแนนที่แทนความสามารถของมนุษย์ต้องมีความซับซ้อนเพียงพอ
จะเห็นว่าคะแนนดิบไม่มีความเหมาะสมเพียงพอที่จะตีความหมายได้ชัดเจนถูกต้อง เป็นที่เข้าใจกันทุกฝ่ายคะแนนที่จะตี
ความหมายสมบูรณ์จึงต้องแปลงเป็นคะแนนมาตรฐานก่อน
คะแนนจากการสอบวัดผลผู้เรียนกำหนดขึ้นเพื่อใช้เปรียบเทียบ แต่มิใช่เพื่อการบอกจำนวนหรือปริมาณมากน้อย
ดังนั้นการให้คะแนนของผู้เรียนแต่ละคนจึงต้องอาศัยการเปรียบเทียบเป็นหลักสำคัญ ซึ่งอาจกำหนดโดยการเปรียบเทียบกันภาย
ใน
กลุ่มผู้เรียน (ซึ่งเรียกว่าการตัดสินแบบอิงกลุ่ม) หรือเปรียบเทียบกับเกณฑ์ที่กำหนดไว้ (ซึ่งก็เรียกว่าการตัดสินแบบอิงเกณฑ์)
ระบบการให้คะแนนจะเป็นแบบใดก็แล้วแต่สถาบันจะเห็นเหมาะสม คะแนนจะเป็นสื่อความหมายที่ดีได้เมื่อเครื่องมือใน
การวัดมีความเที่ยงตรง (Validity) และเชื่อถือได้ (Reliability) การเปรียบเทียบหรือรวมคะแนนที่ได้จากการสอบที่ไม่เหมือนกัน
จึงต้องพยายามให้คะแนนแต่ละจำนวนมีหน่วยคงที่ซึ่งต้องอาศัยระเบียบวิธีทางสถิติ