ฟังก์ชันที่ส่งคืนค่า R-squared (R²) หรือสัมประสิทธิ์การตัดสินใจ แสดงสัดส่วนของความแปรปรวนในตัวแปรตามที่สามารถอธิบายได้จากตัวแปรอิสระ ค่าอยู่ระหว่าง 0 ถึง 1
=RSQ(known_y's, known_x's)
=RSQ(known_y's, known_x's)
| Argument | Type | Required | Default | Description |
|---|---|---|---|---|
| known_y's | Range/Array | Yes | อาร์เรย์หรือช่วงของค่า y ที่ทราบ (ตัวแปรตาม) – ตัวเลขหรือช่องว่างเท่านั้น ไม่รวมข้อความ | |
| known_x's | Range/Array | Yes | อาร์เรย์หรือช่วงของค่า x ที่ทราบ (ตัวแปรอิสระ) – ต้องมีจำนวนเซลล์เท่าเดียวกับ known_y’s |
สมมติ A2:A10 = ยอดขายจริง [1000, 1500, 2000, 2500, 3000, 3500, 4000, 4500, 5000] B2:B10 = ยอดขายที่คาดการณ์ [950, 1480, 2050, 2450, 3100, 3400, 4100, 4400, 5100…สมมติ A2:A10 = ยอดขายจริง [1000, 1500, 2000, 2500, 3000, 3500, 4000, 4500, 5000]
B2:B10 = ยอดขายที่คาดการณ์ [950, 1480, 2050, 2450, 3100, 3400, 4100, 4400, 5100]
=RSQ(A2:A10, B2:B10)
0.9891
สมมติ C2:C8 = เวลาเรียน (ชั่วโมง) [10, 15, 8, 20, 12, 18, 14] D2:D8 = คะแนนสอบ [65, 75, 60, 85, 70, 82, 78] =RSQ(D2:D8, C2:C8)สมมติ C2:C8 = เวลาเรียน (ชั่วโมง) [10, 15, 8, 20, 12, 18, 14]
D2:D8 = คะแนนสอบ [65, 75, 60, 85, 70, 82, 78]
=RSQ(D2:D8, C2:C8)
0.7632
กรณีที่ 1: =RSQ(E2:E20, F2:F20) → ผลลัพธ์ 0.82 กรณีที่ 2: =RSQ(G2:G20, H2:H20) → ผลลัพธ์ 0.45กรณีที่ 1: =RSQ(E2:E20, F2:F20) → ผลลัพธ์ 0.82
กรณีที่ 2: =RSQ(G2:G20, H2:H20) → ผลลัพธ์ 0.45
กรณีที่ 1 = 0.82, กรณีที่ 2 = 0.45
สมมติ I2:I6 = คะแนนสอบวิชา A [88, 92, 85, 90, 87] J2:J6 = เลขประจำตัวประชาชน [1001, 1002, 1003, 1004, 1005] =RSQ(I2:I6, J2:J6)สมมติ I2:I6 = คะแนนสอบวิชา A [88, 92, 85, 90, 87]
J2:J6 = เลขประจำตัวประชาชน [1001, 1002, 1003, 1004, 1005]
=RSQ(I2:I6, J2:J6)
0.0024
ขึ้นอยู่กับบริบท:
– ข้อมูลธรรมชาติ (ธรรมณฑ์, อุตุนิยมวิทยา): 0.5 ถือว่าดี
– ข้อมูลการเงิน/การขายที่ควบคุมได้: 0.5 ต่ำ ต้อง 0.7 ขึ้นไป
– ข้อมูลวิทยาศาสตร์: 0.9+ ปกติ
CORREL ให้ r (correlation coefficient) อยู่ระหว่าง -1 ถึง 1
RSQ ให้ r² (ค่าที่ยกกำลังสอง) อยู่ระหว่าง 0 ถึง 1
ถ้า CORREL = 0.8 → RSQ = 0.64
ถ้า CORREL = -0.8 → RSQ = 0.64 (ลบหาย เพราะยกกำลังสอง)
เหตุผลที่พบบ่อย:
1. ตัวแปร X ไม่เกี่ยวข้อง → เปลี่ยนตัวแปร
2. มีค่า Outlier ที่ผิดปกติ → ตรวจสอบและลบ
3. ความสัมพันธ์ไม่เป็นเชิงเส้น → ใช้ Polynomial หรือ Exponential Regression
4. ข้อมูลมีสัญญาณรบกวนสูง → ต้องข้อมูลที่ดีกว่า
ได้! ถ้า x และ y สัมพันธ์กันอย่างสมบูรณ์แบบ (Perfect linear relationship)
ตัวอย่าง: x = [1, 2, 3, 4], y = [2, 4, 6, 8] → RSQ = 1.0
แต่ในโลกจริง หาได้ยากมาก
RSQ ไม่ทนต่อ Outlier:
– หากไม่แน่ใจ ให้ใช้ CORREL หรือ PEARSON (ให้ผลคล้ายๆ กัน)
– ตัวอื่น: TRIMEAN, Robust Regression (Excel ไม่มี, ต้อง R หรือ Python)
RSQ คือฟังก์ชันทางสถิติที่บอกว่าโมเดลถดถอยเชิงเส้นอธิบายข้อมูลได้ดีแค่ไหน
ที่เจ๋งคือ ค่า R-squared ใช้วัด “ความแม่นยำ” ของสมการแนวโน้ม ถ้า R² = 0.95 หมายถึง 95% ของการเปลี่ยนแปลง y สามารถอธิบายได้ด้วย x
ส่วนตัวผม ถ้าคุณสร้าง Trendline ในกราฟ RSQ ช่วยให้รู้ว่า “เส้นนี้ตรงกับข้อมูลจริงมั้ย?” ถ้า R² ต่ำ (เช่น 0.3) แสดงว่าเส้นไม่เหมาะสม ควรใช้สมการอื่น 😎