คะแนนที่ได้จากการตรวจคำตอบ ผลงานของผู้เรียน หรือการสังเกตผลการปฏิบัติ คะแนนเหล่านี้เราเรียกว่าคะแนนดิบซึ่งคะแนนดิบเป็นเพียงสิ่งที่บอกว่าผู้เรียนทำข้อสอบได้  มากน้อยเพียงใด ไม่สามารถบอกว่านักเรียนแต่ละคนเก่ง อ่อนเท่าใด นักเรียนที่ทำคะแนนได้  50  คะแนน จากคะแนนเต็ม 100 คะแนน ไม่ได้บอกว่านักเรียนมีความเก่งปานกลาง เพราะทำข้อสอบได้ครึ่งหนึ่งของคะแนนเต็ม    ทั้งนี้ขึ้นอยู่กับความยาก – ง่ายของข้อสอบ
         ดังนั้นจะเห็นได้ว่า คะแนนดิบไม่มีความหมายเพียงพอที่จะนำมาเปรียบเทียบกันได้ เนื่องจากคะแนนดิบมีความไม่เหมาะสมหลายประการ  คือ
          1.  หน่วยของคะแนนที่ใช้วัดไม่สมบูรณ์ ไม่มีความหมาย เปรียบเทียบไม่ได้
          2.  คะแนนดิบไม่มีความคงที่
          3.  คะแนนที่แทนความสามารถของมนุษย์ต้องมีความซับซ้อนเพียงพอ
           จะเห็นว่าคะแนนดิบไม่มีความเหมาะสมเพียงพอที่จะตีความหมายได้ชัดเจนถูกต้อง เป็นที่เข้าใจกันทุกฝ่ายคะแนนที่จะตี
ความหมายสมบูรณ์จึงต้องแปลงเป็นคะแนนมาตรฐานก่อน
           คะแนนจากการสอบวัดผลผู้เรียนกำหนดขึ้นเพื่อใช้เปรียบเทียบ แต่มิใช่เพื่อการบอกจำนวนหรือปริมาณมากน้อย
ดังนั้นการให้คะแนนของผู้เรียนแต่ละคนจึงต้องอาศัยการเปรียบเทียบเป็นหลักสำคัญ ซึ่งอาจกำหนดโดยการเปรียบเทียบกันภาย
ใน กลุ่มผู้เรียน (ซึ่งเรียกว่าการตัดสินแบบอิงกลุ่ม) หรือเปรียบเทียบกับเกณฑ์ที่กำหนดไว้ (ซึ่งก็เรียกว่าการตัดสินแบบอิงเกณฑ์)
         ระบบการให้คะแนนจะเป็นแบบใดก็แล้วแต่สถาบันจะเห็นเหมาะสม คะแนนจะเป็นสื่อความหมายที่ดีได้เมื่อเครื่องมือใน
การวัดมีความเที่ยงตรง (Validity) และเชื่อถือได้ (Reliability)  การเปรียบเทียบหรือรวมคะแนนที่ได้จากการสอบที่ไม่เหมือนกัน
จึงต้องพยายามให้คะแนนแต่ละจำนวนมีหน่วยคงที่ซึ่งต้องอาศัยระเบียบวิธีทางสถิติ