Wednesday 17 January 2018

All possible regressions in stata forex


Análise de Regressão Múltipla usando Stata Introdução A regressão múltipla (uma extensão da regressão linear simples) é usada para prever o valor de uma variável dependente (também conhecida como variável de resultado) com base no valor de duas ou mais variáveis ​​independentes (também conhecidas como variáveis ​​preditoras ). Por exemplo, você pode usar uma regressão múltipla para determinar se a ansiedade do exame pode ser prevista com base na marca do curso, tempo de revisão, atendimento de conferência e pontuação de QI (ou seja, a variável dependente seria a ansiedade do exame e as quatro variáveis ​​independentes seriam a nota do curso, a revisão Tempo, atendimento de conferência e pontuação de QI). Alternativamente, você poderia usar uma regressão múltipla para determinar se a renda pode ser prevista com base na idade, gênero e nível educacional (ou seja, a variável dependente seria renda e as três variáveis ​​independentes seriam idade, gênero e nível educacional). Se você tem uma variável dependente dicotômica, você pode usar uma regressão logística binomial. A regressão múltipla também permite que você determine o ajuste geral (variação explicada) do modelo e a contribuição relativa de cada uma das variáveis ​​independentes para a variância total explicada. Por exemplo, você pode querer saber o quanto da variação na ansiedade do exame pode ser explicada pela nota do curso, tempo de revisão, atendimento de conferência e pontuação de QI como um todo, mas também a contribuição relativa de cada variável independente na explicação da variância. Este guia de início rápido mostra como realizar uma regressão múltipla usando o Stata, bem como como interpretar e relatar os resultados desse teste. No entanto, antes de apresentarmos este procedimento, você precisa entender os diferentes pressupostos que seus dados devem atender para que a regressão múltipla lhe dê um resultado válido. Nós discutimos estes pressupostos a seguir. Suposições Existem oito pressupostos que sustentam a regressão múltipla. Se qualquer um desses oito pressupostos não for cumprido, você não pode analisar seus dados usando uma regressão múltipla porque você não obterá um resultado válido. Como as suposições 1 e 2 referem-se à sua escolha de variáveis, elas não podem ser testadas para usar o Stata. No entanto, você deve decidir se seu estudo atende a essas premissas antes de seguir em frente. Assunção 1: sua variável dependente deve ser medida no nível contínuo. Exemplos de tais variáveis ​​contínuas incluem altura (medida em pés e polegadas), temperatura (medida em 176C), salário (medido em dólares norte-americanos), tempo de revisão (medido em horas), inteligência (medida com o escore de QI), tempo de reação Em milissegundos), o desempenho do teste (medido de 0 a 100), as vendas (medidas em número de transações por mês), e assim por diante. Se você não tem certeza se sua variável dependente é contínua (ou seja, medido no intervalo ou nível de relação), consulte o nosso Guia de Tipos de Variáveis. Assunção 2: você possui duas ou mais variáveis ​​independentes. Que deve ser medido no nível contínuo ou categórico. Para exemplos de variáveis ​​contínuas. Veja a bala acima. Exemplos de variáveis ​​categóricas incluem gênero (por exemplo, 2 grupos: masculino e feminino), etnia (por exemplo, 3 grupos: caucasiano, afro-americano e hispânico), nível de atividade física (por exemplo, 4 grupos: sedentário, baixo, moderado e alto), profissão (eg 5 grupos: cirurgião, médico, enfermeiro, dentista, terapeuta) e assim por diante. Neste guia, mostramos o procedimento de regressão múltipla porque temos uma mistura de variáveis ​​independentes contínuas e categóricas. Nota: Se você tem apenas variáveis ​​independentes categóricas (ou seja, não há variáveis ​​independentes contínuas), é mais comum abordar a análise a partir da perspectiva de uma ANOVA bidirecional (para duas variáveis ​​independentes categóricas) ou ANOVA fatorial (para três ou mais categórico Variáveis ​​independentes) em vez de regressão múltipla. Felizmente, você pode verificar os pressupostos 3, 4, 5, 6, 7 e 8 usando o Stata. Ao passar às premissas 3, 4, 5, 6, 7 e 8, sugerimos testá-las nesta ordem porque representa uma ordem em que, se uma violação ao pressuposto não for corrigível, você não poderá mais usar múltiplas regressão. Na verdade, não se surpreenda se seus dados falharem em uma ou mais dessas premissas, pois isso é bastante típico quando se trabalha com dados do mundo real, em vez de exemplos de livros didáticos, que geralmente mostram apenas como realizar uma regressão linear quando tudo corre bem. No entanto, não se preocupe, porque mesmo quando seus dados falham em certos pressupostos, muitas vezes há uma solução para superar isso (por exemplo, transformar seus dados ou usar outro teste estatístico em vez disso). Basta lembrar que, se você não verificar se seus dados atendem a essas premissas ou você as testou corretamente, os resultados obtidos ao executar a regressão múltipla podem não ser válidos. Assunção 3: Você deve ter independência de observações (isto é, independência de resíduos), que você pode verificar em Stata usando a estatística de Durbin-Watson. Assunção 4: Deve haver uma relação linear entre (a) a variável dependente e cada uma de suas variáveis ​​independentes, e (b) a variável dependente e as variáveis ​​independentes coletivamente. Você pode verificar a linearidade em Stata usando diagramas de dispersão e gráficos de regressão parcial. Assunção 5: seus dados precisam mostrar homoscedasticidade. Que é onde as variações ao longo da linha de melhor ajuste permanecem similares à medida que você se move ao longo da linha. Você pode verificar a homoscedasticidade em Stata, traçando os resíduos estudados contra os valores preditos não padronizados. Assunção 6: seus dados não devem mostrar multicolinearidade. Que ocorre quando você tem duas ou mais variáveis ​​independentes que estão altamente correlacionadas entre si. Você pode verificar esta suposição em Stata através de uma inspeção de coeficientes de correlação e valores ToleranceVIF. Assunção 7: Não deve haver valores atípicos significativos. Pontos altos de alavancagem ou pontos altamente influentes. Que representam observações em seu conjunto de dados que são de alguma forma incomuns. Estes podem ter um efeito muito negativo na equação de regressão que é usada para prever o valor da variável dependente com base nas variáveis ​​independentes. Você pode verificar por outliers, pontos de alavanca e pontos influentes usando o Stata. Assunção 8: Os resíduos (erros) devem ser aproximadamente normalmente distribuídos. Que você pode verificar em Stata usando um histograma (com uma curva normal sobreposta) e Plot P-P Normal, ou um Lote Q-Q Normal dos resíduos estudados. Na prática, verificar as hipóteses 3, 4, 5, 6, 7 e 8 provavelmente ocuparão a maior parte do tempo ao realizar uma regressão múltipla. No entanto, não é uma tarefa difícil, e a Stata fornece todas as ferramentas que você precisa para fazer isso. Na seção, Procedimento de teste em Stata. Ilustramos o procedimento Stata necessário para executar uma regressão múltipla assumindo que nenhum pressuposto foi violado. Primeiro, apresentamos o exemplo que usamos para explicar o procedimento de regressão múltipla na Stata. Um pesquisador de saúde quer ser capaz de prever VO 2 max, um indicador de aptidão física e saúde. Normalmente, para executar este procedimento requer equipamento de laboratório caro, além de exigir que os indivíduos exercem seu máximo (isto é, até que eles não possam continuar exercendo devido ao esgotamento físico). Isso pode afastar indivíduos que não são muito ativos e aqueles que podem estar em maior risco de saúde (por exemplo, assuntos mais antigos inaptos). Por estas razões, foi desejável encontrar uma maneira de prever um indivíduo VO 2 max com base em atributos que podem ser medidos de forma mais fácil e econômica. Para este fim, um pesquisador recrutou 100 participantes para realizar um teste máximo VO 2 max, mas também registrou sua idade, peso, freqüência cardíaca e gênero. A freqüência cardíaca é a média dos últimos 5 minutos de 20 minutos, muito mais fácil, menor teste de ciclagem de carga de trabalho. O objetivo dos pesquisadores é poder prever o VO 2 max com base nesses quatro atributos: idade, peso, freqüência cardíaca e gênero. Nota: O exemplo e os dados utilizados para este guia são fictícios. Acabamos de criá-los para os propósitos deste guia. Configuração em Stata In Stata, criamos cinco variáveis: (1) VO 2 max. Qual é a capacidade aeróbica máxima (isto é, a variável dependente) e (2) idade. Qual é o peso dos participantes (3). Qual é o peso dos participantes (tecnicamente, é a massa deles) (4) heartrate. Qual é a freqüência cardíaca dos participantes e (5) gênero. Qual é o gênero dos participantes (ou seja, as variáveis ​​independentes). Depois de criar essas cinco variáveis, inserimos as pontuações para cada uma nas cinco colunas da planilha do Editor de Dados (Editar), conforme mostrado abaixo: Publicado com permissão por escrito da StataCorp LP. Procedimento de teste no Stata Nesta seção, mostramos como analisar seus dados usando regressão múltipla no Stata quando os oito pressupostos na seção anterior, Suposições. Não foram violados. Você pode realizar uma regressão múltipla usando código ou interface gráfica do usuário do Statas (GUI). Depois de ter realizado sua análise, mostramos como interpretar seus resultados. Primeiro, escolha se deseja usar o código ou a interface gráfica do usuário Statas (GUI). O código para realizar uma regressão múltipla em seus dados assume a forma: regressar DependenteVariável IndependenteVariable1 IndependenteVariable2 IndependenteVariable3 IndependenteVariable4 Usando nosso exemplo onde a variável dependente é VO2max e as quatro variáveis ​​independentes são idade. peso. Heartrate e gênero. O código necessário seria: regress VO2max idade peso musculação i. gender Nota: Você verá a partir do código acima que as variáveis ​​independentes contínuas são simplesmente inseridas como está, enquanto as variáveis ​​independentes categóricas têm o prefixo i (por exemplo, idade para idade, uma vez que é um Variável independente contínua, mas i. gender para gênero, uma vez que esta é uma variável independente categórica). Portanto, digite o código, regresse VO2max age weight heartrate i. gender. E pressione o botão ReturnEnter no seu teclado. Você pode ver a saída da Stata que será produzida aqui. Interface Gráfica do Usuário (GUI) Os sete passos necessários para realizar a regressão múltipla no Stata são mostrados abaixo: Clique em Estatísticas gt Modelos lineares e gt relacionados Regressão linear no menu principal, conforme mostrado abaixo: Publicado com permissão por escrito da StataCorp LP. Nota: Não se preocupe com a seleção de estatísticas gt Modelos lineares e gt relacionados Regressão linear no menu principal, ou que as caixas de diálogo nas etapas a seguir tenham o título, Regressão linear. Você não cometeu um erro. Você está no lugar correto para realizar o procedimento de regressão múltipla. Este é apenas o título que a Stata oferece, mesmo quando executa um procedimento de regressão múltipla. Você será apresentado com a regressão - caixa de diálogo de regressão linear, conforme mostrado abaixo: Publicado com permissão por escrito da StataCorp LP. Selecione a variável dependente, VO2max. Da variável Dependente: caixa e selecione as variáveis ​​independentes contínuas, idade. Peso e musculação das variáveis ​​independentes: caixa, usando o botão suspenso, conforme mostrado abaixo: Publicado com permissão por escrito da StataCorp LP. Selecione a variável independente categórica, gênero. Das variáveis ​​independentes: caixa, primeiro clicando no botão. Isto irá apresentá-lo com a seguinte caixa de diálogo onde suas variáveis ​​independentes contínuas (idade e peso) serão já inseridas na caixa Varlist: Publicado com permissão por escrito da StataCorp LP. Deixe a variável Fator selecionada no ndashType da área variablendash. Em seguida, na área ndashAdd factor variablendash, deixe selecionado na caixa Especificação :. Agora, selecione gênero na caixa Variáveis ​​usando o botão suspenso e selecione Padrão na caixa Base. Finalmente, clique no botão. Você receberá a seguinte caixa de diálogo onde a variável categórica independente, i. gender. Foi inserido na caixa Varlist: Publicado com permissão por escrito da StataCorp LP. Clique no botão. Você será retornado à regressão - caixa de diálogo de regressão linear, mas com a variável independente categórica, i. gender. Agora entrou na variável independente: caixa, conforme mostrado abaixo: Publicado com permissão por escrito da StataCorp LP. Clique no botão. Isso gerará a saída. Interpretando e Reportando a Saída Stata da Análise de Regressão Múltipla A Stata gerará uma única peça de saída para uma análise de regressão múltipla com base nas seleções feitas acima, assumindo que as oito premissas necessárias para a regressão múltipla foram atendidas. Determinando o quão bem o modelo se encaixa O R 2 e o R 2 ajustado podem ser usados ​​para determinar o quão bem um modelo de regressão se ajusta aos dados: A linha R-quadrado representa o valor R 2 (também chamado de coeficiente de determinação), que é a proporção De variância na variável dependente que pode ser explicada pelas variáveis ​​independentes (tecnicamente, é a proporção de variação explicada pelo modelo de regressão acima e além do modelo médio). Você pode ver do nosso valor de 0.577 que nossas variáveis ​​independentes explicam 57.7 da variabilidade de nossa variável dependente, VO 2 max. No entanto, você também precisa ser capaz de interpretar o Adj R-squared (adj. R 2) para informar com precisão seus dados. Significado estatístico O F - ratio comprova se o modelo de regressão geral é adequado para os dados. A saída mostra que as variáveis ​​independentes predizem estatisticamente significativamente a variável dependente, F (4, 95) 32,39, p lt .0005 (ou seja, o modelo de regressão é um bom ajuste dos dados). Coeficientes de modelo estimados A forma geral da equação para prever VO 2 max de idade. peso. O sexo e o gênero são: Núcleo predicado VO 2 max 87,83 ndash (0,165 x idade) ndash (0,385 x peso) ndash (0.118 x heartrate) (13.208 x gênero) Isto é obtido no Coef. Coluna, como mostrado abaixo: Os coeficientes não padronizados indicam o quanto a variável dependente varia com uma variável independente, quando todas as demais variáveis ​​independentes são mantidas constantes. Considere o efeito da idade neste exemplo. O coeficiente não padronizado, B 1. Para a idade é igual a -0.165 (veja a primeira linha da coluna Coef.). Isto significa que, para cada aumento de 1 ano de idade, há uma diminuição no VO 2 max de 0,165 mlminkg. Significado estatístico das variáveis ​​independentes Você pode testar a significância estatística de cada uma das variáveis ​​independentes. Isso testa se os coeficientes não padronizados (ou padronizados) são iguais a 0 (zero) na população. Se p lt .05, você pode concluir que os coeficientes são estatisticamente significativamente diferentes de 0 (zero). O valor t e o valor p correspondente estão localizados nas colunas t e Pgtt, respectivamente, como destacado abaixo: você pode ver na coluna Pgtt que todos os coeficientes de variáveis ​​independentes são estatisticamente significativamente diferentes de 0 (zero). Embora a intercepção, B 0. É testado quanto à significância estatística, isso raramente é uma descoberta importante ou interessante. Relatando o resultado da análise de regressão múltipla Você poderia escrever os resultados da seguinte maneira: uma regressão múltipla foi executada para prever o VO 2 max do gênero, idade, peso e freqüência cardíaca. Essas variáveis ​​previam estatisticamente significativamente VO 2 max, F (4, 95) 32,39, p lt. 0005, R 2, 577. As quatro variáveis ​​adicionaram estatisticamente significativamente à predição, p lt .05.NOTICE: O grupo de consultoria IDRE estatística estará migrando o site para o WordPress CMS em fevereiro para facilitar a manutenção e criação de novos conteúdos. Algumas de nossas páginas antigas serão removidas ou arquivadas de modo que elas não serão mais mantidas. Vamos tentar manter os redirecionamentos para que os URLs antigos continuem a funcionar da melhor maneira possível. Bem-vindo ao Instituto de Pesquisas Digitais e Educação Ajude o Grupo de Consultoria Stat ao oferecer um presente Programas Stata para Análise de Dados Esta página descreve os programas Stata desenvolvidos pelo UCLA ATS Statistical Consulting Group para análise de dados. Você pode baixar qualquer um desses programas no Stata usando o comando findit. Por exemplo, para baixar o comando cmeans, você pode digitar findec cmeans (consulte Como posso usar o comando findit para procurar programas e obter ajuda adicional para obter mais informações sobre o uso do findit). Por favor, note: os programas xi3 e postgr3 foram retirados e não estão mais disponíveis para download.

No comments:

Post a Comment