Thursday 16 November 2017

Autoregressive Moving Average Stata


Stata: análise de dados e software estatístico Análise de séries temporais usando Stata Este curso analisa métodos para análise de séries temporais e mostra como realizar a análise usando o Stata. O curso abrange métodos para gerenciamento de dados, estimativa, seleção de modelo, teste de hipóteses e interpretação. Para problemas univariados, o curso abrange os modelos de média móvel auto - ressiva (ARMA), filtros lineares, modelos de memória longa, modelos de componentes não observados e modelos autoregressivos condicionalmente heterossejidos (GARCH) generalizados. Para problemas multivariados, o curso abrange modelos vetoriais autorregressivos (VAR), modelos co-integrantes VAR, modelos de espaço-estado, modelos de fatores dinâmicos e modelos GARCH multivariados. Os exercícios complementarão as palestras e os exemplos do Stata. Oferecemos um desconto de 15 para inscrições grupais de três ou mais participantes. Uma revisão rápida dos elementos básicos da análise de séries temporais Gerenciando e resumindo os dados das séries temporais Modelos univariados Movendo processos médios e autoregressivos Modelos ARMA Modelos ARMA estacionários para dados não estacionários Modelos sazonais multiplicativos Tendências deterministas versus estocásticas Modelos auto-agressivos condicionalmente heterossejidos Média móvel auto-divertida integrada fraccionalmente Modelo Testes para rupturas estruturais Novos modelos de mudança de Markov Nova introdução à previsão em filtros Stata Filtros lineares Uma introdução rápida ao domínio de freqüência O modelo de componentes não observados univariados Modelos multivariados Modelos autorregressivos vetoriais Um modelo para variáveis ​​de cointegração Modelos de espaço-estado Resposta de impulso e análise de decomposição de variância Novos modelos de fatores dinâmicos GARCH multivariante Uma familiaridade geral com o Stata e um curso de nível de pós-graduação em análise de regressão ou experiência comparável. Bem-vindo ao Instituto de Pesquisa e Educação Digital Medida Repetida S Análise com Dados Stata: largo versus longo Os dados de medidas repetidas são fornecidos em dois formatos diferentes: 1) de largura ou 2) de comprimento. No formato amplo, cada assunto aparece uma vez com as medidas repetidas na mesma observação. Para dados no formato longo, há uma observação para cada período de tempo para cada assunto. Aqui está um exemplo de dados no formato amplo por quatro períodos de tempo. No acima, y1 é a variável de resposta no momento um. Em forma longa, os dados se parecem com isso. Observe que o tempo é uma variável explícita com dados de formulário longo. Esse formato é chamado de dados por período de pessoa por alguns pesquisadores. Stata analisa medidas repetidas tanto para anova quanto para modelos mistos lineares em forma prolongada. Por outro lado, SAS e SPSS geralmente analisam a análise repetida anova em ampla forma. No entanto, SAS e SPSS exigem o uso de modelos de dados de dados longos. O conjunto de dados de exemplo Nosso conjunto de dados de exemplo é chamado de medições repetidas e pode ser baixado com o seguinte comando. Há um total de oito assuntos medidos em quatro pontos de tempo cada. Esses dados estão em formato amplo onde y1 é a resposta no instante 1, y2 é a resposta no tempo 2 e assim por diante. Os sujeitos são divididos em dois grupos de quatro sujeitos usando a variável trt. Aqui estão as estatísticas descritivas básicas em cada um dos quatro pontos de tempo combinados e quebrados pelo grupo de tratamento. Em seguida, vamos representar os oito meios celulares com o comando escrito pelo usuário, perfil. Você pode baixar este comando digitando findit profileplot é a janela de comando do Stata. Agora, olhemos as matrizes de correlação e covariância das respostas ao longo do tempo. A medida repetida anova assume que a estrutura de covariância dentro do assunto é simétrica composta. A matriz de covariância acima não parece ter simetria composta. Vamos discutir a covariância dentro do assunto em maior detalhe mais tarde na apresentação. Redime de largo para longo. Agora que analisamos algumas das estatísticas descritivas, podemos reformular os dados em forma longa usando o comando remodelar. A opção i () fornece a variável que identifica o assunto enquanto a opção j () cria uma nova variável que indica o período de tempo. Agora que nós reformulamos os dados, podemos avançar para medidas repetidas anova. Repetidas medidas anova Na linguagem anova, este design tem efeitos entre sujeitos e dentro do assunto, ou seja, é um modelo de efeitos mistos. Em particular, esse design às vezes é referido como uma análise fatorial de variância dividida. Em Stata, com os dados em forma longa, precisamos especificar os termos de erro para os efeitos entre sujeitos e dentro do assunto. Em geral, a regra é que existe um único termo de erro para todos os efeitos entre os sujeitos e um termo de erro separado para cada um dos fatores internos e para a interação de fatores internos. Nosso modelo é relativamente simples com apenas dois termos de erro. O efeito entre os sujeitos é o tratamento (trt) e seu termo de erro é sujeito aninhado no tratamento (id trt). O tempo de tempo do fator dentro do assunto. Seu termo de erro é o erro residual para o modelo. As medidas repetidas anova têm uma suposição de que a estrutura de covariância dentro do assunto é simétrica composta, também conhecida como, permutável. Com simetria composta, espera-se que as variações em cada tempo sejam iguais e que todas as covariâncias sejam iguais entre si. Se a estrutura de covariância dentro do assunto não for simétrica composta, os valores p obtidos das medidas repetidas anova podem não refletir com precisão as probabilidades verdadeiras. O Stata permite que você considere a falta de simetria composta, incluindo a opção repetida () no comando anova que calcula p-valores para testes F conservadores. Vamos discutir as estruturas de covariância em maior profundidade mais tarde na apresentação. Aqui está o comando anova para nossos dados. A interação tratamento por momento é significativa, assim como os dois efeitos principais para o tratamento e o tempo. A saída inclui os valores de p para três testes F conservadores diferentes: 1) Huynh-Feldt, 2) Greenhouse-Geisser e 3) Boxs conservative F. Esses valores são indicadores do valor p é mesmo se os dados não se encontrarem A hipótese de simetria composta. Podemos ver a matriz de covariância dentro do assunto agrupada listando a matriz Srep. A inspeção da matriz de covariância dentro do assunto agrupada duvida da validade da suposição de simetria composta. Felizmente, os valores de p para o teste F conservador ainda indicam efeitos significativos para a interação trttime e o efeito principal do tempo. Testes de efeitos simples Uma vez que a interação tratamento por momento é significativa, devemos tentar explicar a interação. Uma maneira de fazer isso é através do uso de teste de efeitos simples. Começaremos por analisar o efeito do tempo em cada nível de tratamento. O efeito do tempo em cada tratamento O efeito simples do tempo tem três graus de liberdade para cada nível do tratamento para um total de seis graus de liberdade. Este teste de efeitos simples usará o erro residual para o modelo como seu termo de erro. Usaremos o comando de contraste para fazer o teste de efeitos simples. Acompanhamento de parcelas Uma vez que cada um dos testes de efeitos simples envolve quatro pontos de tempo, acompanhará as comparações por pares usando o comando de margens com a opção pwcompare. Anova com termo de erro combinado Os testes de tratamento em cada ponto de ligação requerem o uso do erro combinado. Ou seja, agrupando id trt e o erro residual. Isso é facilmente realizado removendo id trt do comando anova. Observe que os graus de liberdade residuais são agora 24. O efeito do tratamento em cada momento Agora podemos executar os efeitos simples do tratamento em cada momento, novamente usando o comando de contraste. Uma vez que existem dois níveis de tratamento em cada ponto do tempo, há um total de quatro graus de liberdade. Como cada teste é um grau de liberdade, não precisamos fazer nenhum teste de acompanhamento. Gráfico de interação Um gráfico da interação é sempre útil. Utilizaremos o comando de margens e a margem para produzir a trama. Desvantagens de medidas repetidas Anova As medidas repetidas anova sofrem de várias desvantagens, entre elas, não permitem observações desiguais dentro do sujeito, o usuário deve determinar o termo de erro correto para cada efeito assume simetria composta, estrutura de covariância intercambiável, medidas repetidas modelo misto Uma alternativa às medidas repetidas anova é para executar A análise como um modelo misto de medidas repetidas. Vamos fazer isso usando o comando xtmixed. Observe que não precisamos especificar os termos de erro, precisamos apenas especificar o nome da variável em que os dados são repetidos, neste caso id. Aqui está o aspecto do comando xtmixed. Observe, usamos a opção reml para que os resultados sejam comparáveis ​​aos resultados da Anova. Além das estimativas dos efeitos fixos, obtemos dois efeitos aleatórios. Estas são a variância das interceptações e a variância residual que correspondem às variações entre sujeitos e dentro do assunto, respectivamente. Xtmixed produz estimativas para cada termo no modelo individualmente. Para obter testes conjuntos (multi graus de liberdade) da interação e dos principais efeitos, usaremos o comando de contraste. Gráfico de interação Permite representar graficamente a interação usando as mesmas margens e os comandos de margens como anteriormente. Teste de efeitos simples Mais uma vez, podemos usar testes de efeitos simples para entender a interação significativa. Tempo em cada tratamento Uma vez que cada um desses testes de efeitos simples usa três graus de liberdade, seguiremos comparações entre pares. Tratamento a cada momento Teste de tendências pós-hoc Outra maneira de ver esses resultados seria analisar a tendência ao longo do tempo para cada um dos dois grupos. Fazemos isso usando a p. Operador de contraste que fornece coeficientes de uso de polinômios ortogonais. Nós mantemos o operador que usamos nos testes de efeitos simples para dar os resultados por tratamento. Os resultados mostram uma tendência linear significativa tanto para o tratamento 1 como para o tratamento 2. O tratamento 2 tem uma tendência quadrática significativa enquanto o tratamento 1 tem uma tendência cúbica significativa. Teste pós-hoc de interação parcial. Outra alternativa é analisar as interações parciais entre tratamento e tempo. Vamos examinar os dois tratamentos e dois pontos de tempo para cada teste. Para entender nossos testes de interação parcial, ele ajuda a visualizar o gráfico da interação. O primeiro teste analisa as duas linhas entre o tempo 1 e o tempo 2. O próximo teste analisa as linhas entre o tempo 2 e o tempo 3. E o teste final examina as duas linhas entre o tempo 3 e o tempo 4. Para cada um dos Interações parciais que estamos testando se a interação entre as quatro células é significativa. A maneira de configurar os testes de interação parcial é usar o a. (Adjacente) operador de contraste junto com a interação. A explicação é muito mais complexa do que o conceito. Os resultados indicam que não há interação entre o tempo 1 eo tempo 2 ou entre o tempo 2 e o tempo 3. No entanto, há uma interação entre os tempos 3 e 4. Estruturas de covariância dentro do assunto Nós declaramos anteriormente que retornaríamos ao tópico De estruturas de covariância dentro do assunto. Então, vamos ver várias das possíveis estruturas de covariância dentro do assunto. Esta estrutura de covariância trata os efeitos repetidos como sendo totalmente independente, como se o design fosse entre os sujeitos. Simetria composta intercambiável As medidas repetidas anova pressupõem que a estrutura de covariância dentro do assunto possui simetria composta. Existe uma variância única (sigma 2) para todos os 3 pontos do tempo e existe uma única covariância (sigma 1) para cada um dos pares de ensaios. Isso é ilustrado abaixo. Stata chama essa estrutura de covariância intercambiável. Não estruturado Para a covariância não estruturada, cada ponto de tempo tem sua própria variância (por exemplo, sigma 1 2 é a variância do tempo 1) e cada par de pontos de tempo tem sua própria covariância (por exemplo, sigma 21 é a covariância do tempo 1 e do tempo 2). Este é o tipo de estrutura de covariância encontrada análise de variância multivariada (manova). A desvantagem para o uso de covariância não estruturada é o maior número de parâmetros que estão sendo estimados. Autoregressivo Outra estrutura comum de covariância freqüentemente observada em dados de medidas repetidas é uma estrutura autorregressiva, que reconhece que as observações mais próximas são mais correlacionadas do que as medidas mais distantes. Abaixo está um exemplo de uma matriz de covariância autorregressiva 1. Também é possível ter estruturas de tipo autorregressivo de 2 ou 3. Além das estruturas de covariância mostradas acima, a Stata também oferece as seguintes estruturas de covariância: média móvel, banda, toeplitz e exponencial. Exemplo com covariância não estruturada Depois de inspecionar nossa matriz de covariância dentro do assunto, decidimos usar a covariância dentro do assunto não estruturada. Aqui está o teste conjunto (multi grau de liberdade) para a interação. Testes de efeitos simples: trttime Uma vez que a interação é estatisticamente significativa, acompanharemos um teste de efeitos simples do tempo em cada tratamento. Modelos de crescimento Modelo de crescimento linear Também é possível tratar o tempo como uma variável contínua, caso em que o Modelo seria considerado um modelo de crescimento linear. Para simplificar a interpretação do intercepto, vamos começar a zero em vez de um. Fazemos isso criando uma nova variável ctime que é tempo - 1. Precisamos deixar que xtmixed soubesse que estamos tratando o ctime como contínuo usando o c. Prefixo. Note, ao usar um modelo misto, não é necessário que cada assunto seja medido nos mesmos pontos de tempo, embora no nosso caso eles sejam todos medidos nos mesmos quatro pontos de tempo. Aqui está o nosso modelo de crescimento linear. Como você pode ver, o termo de interação ainda é estatisticamente significativo. Você precisa ter cuidado ao interpretar trt e ctime como efeitos principais no sentido anova. O coeficiente ctime é a inclinação de y em ctime no grupo de referência. Enquanto o coeficiente para trt é a diferença nos dois grupos quando ctime é zero. Inclinações simples Podemos usar o comando de margens com a opção dydx para obter as encostas de cada um dos dois grupos de tratamento. Observe que a inclinação para trt 1 é igual ao coeficiente para ctime acima. Também podemos testar a diferença nas encostas usando o comando de margens com codificação de grupo de referência usando o r. Operador de contraste. Não é realmente necessário fazer isso porque já sabemos que a diferença nas inclinações é significante do termo de interação acima. Na verdade, se você tomar o valor z para a interação (3.57) e quadrá-lo (12.7449), você obtém o qui-quadrado mostrado abaixo para dentro do erro de arredondamento. Representação gráfica da interação Podemos visualizar as pistas simples através da representação gráfica da interação usando uma variação de margens com a opção at () juntamente com o comando marginsplot. Modelo de crescimento quadrático Não temos que nos restringir a uma relação linear ao longo do tempo. Podemos incluir facilmente um efeito quadrático repetindo o termo c. ctime em nosso modelo. Representando graficamente o modelo quadrático. Podemos representar gráfico o modelo quadrático usando os mesmos comandos de margens e margens que utilizamos para o modelo linear. Modelo de crescimento cúbico. Se adicionarmos um ctime adicional ao nosso modelo de crescimento quadrático, obtemos um modelo de crescimento cúbico. Representação gráfica do modelo cúbico Inclinações para cada tratamento e ponto de tempo Com uma pequena variação no comando das margens, podemos obter as encostas para cada grupo de tratamento em cada ponto do tempo. Você notará que, para o tratamento 2, as encostas apenas ficam cada vez mais íngremes, enquanto que para o tratamento 1, as encostas aumentam e, em seguida, recuam. Vantagens e desvantagens de modelos mistos Existem vantagens e desvantagens ao usar modelos mistos, mas em geral Os modelos mistos são mais flexíveis e têm mais vantagens do que as desvantagens. Vantagens calcula automaticamente erros padrão corretos para cada efeito permite desequilíbrio ou observações faltantes dentro do assunto permite intervalos de tempo desiguais permite que várias estruturas de covariância dentro do assunto permitam que o tempo seja tratado como categórico ou contínuo Desvantagens xtmixed relatórios resultados como chi-quadrado os valores de p são Apropriado para grandes amostras e é inclinado para baixo em pequenas amostras. O conteúdo deste site não deve ser interpretado como um endosso de qualquer site, livro ou produto de software específico da Universidade da Califórnia.

No comments:

Post a Comment