Почему значение R-Squared ничего не говорит о причинности?

Почему значение R-Squared ничего не говорит о причинности?
Anonim

Ответ:

R-квадрат показывает, насколько хорошо наблюдаемые данные соответствуют ожидаемым данным, но дает только информацию о корреляции.

Объяснение:

Значение R в квадрате показывает, насколько хорошо ваши наблюдаемые данные или собранные вами данные соответствуют ожидаемому тренду. Это значение говорит о силе отношений, но, как и все статистические тесты, ничего не дано, чтобы указать причину отношений или их силу.

В приведенном ниже примере мы видим, что график слева не имеет отношения, на что указывает низкое значение R-квадрата. График справа имеет очень сильную взаимосвязь, о чем свидетельствует значение R в квадрате 1. Ни на одном из этих графиков мы не можем сказать, что в конечном итоге вызывает эту взаимосвязь.

Корреляция не означает причинно-следственную связь. Ваши значения X могут очень хорошо влиять на ваши значения Y, но могут быть и другие факторы, или отношения могут быть случайными. Вы можете делать вывод причинно-следственная связь, но это ваша интерпретация, и она не может быть доказана статистическим тестированием. Наличие высокого значения R-квадрата все еще говорит вам о силе отношений, но не их причине.

Доказать причинно-следственную связь - очень большая задача. Если вы хотите понять причинно-следственную связь, лучше всего делать эксперименты.