Regressão Simples Linear por Augusto Sacramento

regresso-linear-i-21-638

Por Augusto Sacramento

Neste artigo tentarei passar para vocês conceito básico de regressão Linear simples.

Basicamente a ideia de regressão vem do entendimento de tentar modelar fenômeno físico (Ocorrência dia a dia) com modelagem matemática; isto porque em alguns casos temos necessidade de entender estes fenômenos estocásticos para melhor direcionar nossas atividades, seja ela em economia, engenharia, saúde etc.

Pois compreendendo estes fenômenos podemos entender comportamento (Físico, Químico ou Biológico) daquela variável em estudo e assim tomarmos ação de contenção e otimiza-la.

A ideia de Regressão tem objetivo tratar de um valor que não se consegue estimar inicialmente tendo como premissa principal entendimento de Causa e Efeito (Causalidade).

Vale pena lembrar ressaltar que embora a análise de regressão lide com a dependência de uma variável em relação a outras variáveis, ela não implica necessariamente em causa.

Uma relação estatística, por mais forte e sugestiva que seja, jamais pode estabelecer uma relação causal.

As ideias sobre causa devem vir de fora da estatística, enfim, de outra teoria¹.

Na prática temos que relacionar fenômeno em estudo (Teórico) com dados reais; fazendo assim uma analogia de causa e efeito, validando o não modelo regressão em estudo.

Modelo regressão foi introduzido por Francis Galton era o mais novo de nove filhos de um próspero banqueiro, nasceu em uma família socialmente abastada.

Aos 16 anos, começou a aprende medicina, mas interessou-se pela matemática, formando-se nesta. Depois voltou a estudar medicina até à morte do seu pai, decidindo então por viajar e estudar parte da África.

Voltando, escreveu muito a respeito de suas viagens, fez muito sucesso por isso, mas deixou de viajar quando se casou. Deu atenção a meteorologia, criando instrumentos e mapas aperfeiçoados e usados até hoje.

Galton produziu mais de 340 artigos e livros em toda sua vida envolvendo a distribuição geográfica da beleza, a moda, as impressões digitais, a eficácia da oração religiosa e o levantamento de peso.

Também criou o conceito estatístico de correlação, a amplamente promovida regressão à média e várias invenções como um periscópio, um dispositivo para abrir cadeados e uma versão inicial da impressora de teletipo.

Ele foi o primeiro a aplicar métodos estatísticos para o estudo das diferenças e herança humanas de inteligência, e introduziu a utilização de questionários e pesquisas para coletar dados sobre as comunidades humanas, o que ele precisava para obras genealógicas e biográficas e para os seus estudos antropométricos ²

Regressão versus Correlação

A análise de regressão conceitualmente é muito diferente da análise de correlação.

Correlação o objetivo básico é medir a intensidade ou o grau de associação linear entre duas variáveis.

Analisamos então coeficiente de correlação.

Na análise de regressão temos objetivo de prever o valor médio de uma variável com base nos valores fixados de outras variáveis.

Normalmente quando temos correlação forte entre variável resposta (Y) e as variáveis regressoras ou explicativas (X´s) iniciamos pressuposto de viabilidade construção modelo matemático baseado equação empírica, seja ela, linear ou não linear.

Diferença Modelos Empíricos e Analíticos

Modelos empíricos são construídos através de eventos de processos químicos, físicos ou biológicos que ocorrem no dia a dia, gerando uma série de informações que possibilitam modelar dados através de equações e estas podem ser usadas ou não, dependendo das premissas de qualidade do modelo.

Podendo este modelo dá uma ideia do fenômeno em estudo.

Modelos Analíticos são fundamentados em fenômenos físico, químico ou biológico já estudados ou em estudo.

São equações que partem estudo cientifico profundo que tem uma base matemática forte envolvida.

Exemplo:

Teoria Relatividade Restrita de Einstein:

1

Teoria Relatividade Geral de Einstein

2

Este são exemplos de Equações Analíticas desenvolvidas através de fenômenos físicos estudados no passado.

Equações Lineares simples

A regressão linear é chamada “linear” porque se considera que a relação da resposta às variáveis é uma função linear de alguns parâmetros.

Sendo uma das primeiras formas de análise regressiva a ser estudada rigorosamente, e usada extensamente em aplicações práticas.

Isso acontece porque modelos que dependem de forma linear dos seus parâmetros desconhecidos, e as propriedades estatísticas dos estimadores resultantes são fáceis de determinar.

Modelos de regressão linear simples são frequentemente ajustados usando a abordagem dos mínimos quadrados, mas que também pode ser montada de outras maneiras, tal como minimizando a “falta de ajuste” em alguma outra norma (com menos desvios absolutos de regressão), ou através da minimização de uma penalização da versão dos mínimos quadrados³

Para se estimar o valor esperado, usa-se de uma equação, que determina a relação entre ambas as variáveis.

                       Y= α + βX1 + Erro  

6

Estimativa dos fatores α e β

Fatores alfa e Beta podem ser estimados pelos seguintes métodos:

Geralmente utilizamos Método Minimo Quadrado Ponderado

4

Análise Qualidade do Modelo Regressão Linear Simples (MRLS)

Para análise da Qualidade do Modelo Linear Simples temos que seguir algumas premissas:

1- R² – Coeficiente de Determinação ou R² Ajustado >= 0,75

2- Analise ANOVA do Modelo – Teste de Hipótese – Rejeita H0 – Pelo menos um das variáveis independentes tem significância estatística no modelo, ou seja, P value<0,05

3- Análise de Lack of Fit – Falha Ajuste Modelo – Teste de Hipótese – Aceita H0, ou seja Erro puro e Erro do Modelo não interfere qualidade do Modelo, ou seja, P value>=0,05

4- Análise de Resíduos – Avaliar Homoscedasticidade e Heterocedasticidade

4.1 – Análise Gráfica para Homoscedasticidade e Heterocedasticidade

5

O modelo tem que se comportar como Item A. Homocedástico sem Viés ou Tendência.

4.2 Uma outra forma é avaliar se as variâncias são homogêneas ou Heterogêneas utilizando teste de Bartlett ou Levene para Residuos.

Utilizar Teste de Bartlett para Residuos com Distribuição Normal e Levene para Não Normal.

4.21 – A ideia seria levantar resíduos do modelo e separar em 2 grupos;

1 – Grupo – Resíduos abaixo da Mediana

2- Grupo – Resíduos acima da Mediana

Para isso utiliza-se análise de Oneway do JMP onde eles irão avaliar dois grupos distintos de resíduo.

Neste momento fazemos teste avaliando variâncias iguais ou diferentes.

Se variâncias iguais temos tendência Homocedástica do modelo se diferente Heterocedástica.

5- Distribuição Normal do Resíduos – Teste de Hipótese – Utilizando Shapiro-Wilk

Neste Caso Aceitamos H0 – Distribuição Normal ou seja Pvalue>=0,05

Estas 5 premissas têm que ser satisfeita para VALIDAÇÃO MODELO LINEAR SIMPLES.

OBS: TESTES DE VIF, AUTOCORRELAÇÃO E ENDOGENIA SERÁ APLICADO PARA REGRESSÃO LINEAR MULTIPLA ONDE TEMOS MAIS DE 1 PREDITOR.


Referência Bibliografica:

www.cps.fgv.br/cps/pesquisas/Politicas_sociais_alunos/2010/BES_raiz_aanew/pdf/BES_ %20Regress%C3%A3oLinear.pdf

tps://pt.wikipedia.org/wiki/Francis_Galton

 


Maiores informação entrar em contato com: augustosacramento@gmail.com

Vale a pena ler o post original do autor:

Regressão Linear Simples

E também verificar os demais posts do autor:

https://www.linkedin.com/today/author/0_3t9lIRntMukf_b1rkEQZlI?trk=prof-sm


Sobre o autor:  Augusto Sacramento

 

Sobre Augusto Sacramento jan2020

Currículo do Sistema de Currículos Lattes (Augusto Cesar Arantes do Sacramento)

Deixe um comentário