Thursday 23 November 2017

Rescaling Data In Stata Forex


AVISO: O grupo de consultoria estatística IDRE estará migrando o site para o WordPress CMS em fevereiro para facilitar a manutenção e criação de novos conteúdos. Algumas de nossas páginas antigas serão removidas ou arquivadas de modo que elas não serão mais mantidas. Vamos tentar manter os redirecionamentos para que os URLs antigos continuem a funcionar da melhor maneira possível. Bem-vindo ao Instituto de Pesquisas e Educação Digital Ajudar o Grupo de Consultoria Estatal, dando um presente Módulo de Aprendizagem Stata Criando e recodificando variáveis ​​Este módulo mostra como criar e recodificar variáveis. Na Stata você pode criar novas variáveis ​​com gerar e você pode modificar os valores de uma variável existente com substituição e com recodificação. Computação de novas variáveis ​​usando gerar e substituir Vamos usar os dados automaticamente para nossos exemplos. Nesta seção, veremos como calcular variáveis ​​com gerar e substituir. O comprimento variável contém o comprimento do carro em polegadas. Abaixo, veremos estatísticas resumidas para o comprimento. Permite usar o comando generate para criar uma nova variável que tenha o comprimento em pés em vez de polegadas, chamado lenft. Devemos enfatizar que gerar é criar uma nova variável. Para uma variável existente, você precisa usar o comando substituir (não gerar). Conforme mostrado abaixo, usamos substituir para repetir a atribuição para lenft. A sintaxe de gerar e substituir é idêntica, exceto: - gerar trabalhos quando a variável ainda não existe e dará um erro se a variável já existir. - substituir obras quando a variável já existe e dará um erro se a variável ainda não existir. Suponhamos que queríamos fazer uma variável chamada length2 que tenha um comprimento quadrado. Ou talvez possamos fazer loglen, que é o log natural do comprimento. Permite obter o desvio padrão médio e o comprimento e podemos fazer escores Z de comprimento. A média é 187.93 e o desvio padrão é 22.27, então o zlength pode ser calculado como mostrado abaixo. Com gerar e substituir você pode usar - para adição e subtração você pode usar para multiplicação e divisão que você pode usar para expoentes (por exemplo, length2) você pode usar () para controlar a ordem das operações. Recodificação de novas variáveis ​​usando gerar e substituir Suponha que queríamos quebrar o mpg em três categorias. Vamos ver uma tabela de mpg para ver onde podemos desenhar as linhas para essas categorias. Permite converter mpg em três categorias para ajudar a tornar isso mais legível. Aqui convertem o mpg em três categorias usando gerar e substituir. Vamos usar tabulações para verificar se isso funcionou corretamente. Na verdade, você pode ver que um valor de 1 para mpg3 vai de 12-18, um valor de 2 vai de 19-23 e um valor de 3 vai de 24-41. Agora, poderíamos usar mpg3 para mostrar uma tabela de crosstag de mpg3 por estrangeiros para contrastar a quilometragem dos carros estrangeiros e domésticos. A tabela de referência acima mostra que 21 dos carros domésticos se enquadram na categoria de alta quilometragem, enquanto 55 dos carros estrangeiros se enquadram nesta categoria. Recodificação de variáveis ​​usando recode Existe uma maneira mais fácil de recodificar mpg para três categorias usando gerar e recodificar. Primeiro, fazemos uma cópia do mpg. Chamando mpg3a. Então, usamos recode para converter o mpg3a em três categorias: min-18 em 1, 19-23 em 2 e 24-max em 3. Vamos verificar duas vezes para ver se isso funcionou corretamente. Vemos que funcionou perfeitamente. Recodes com se permite criar uma variável chamada mpgfd que avalia a quilometragem dos carros em relação à sua origem. Deixe que esta seja uma variável de 01 chamada mpgfd, que é: 0 se abaixo do mpg médio para o seu grupo (domino estrangeiro) 1 se atabo o mpg médio para o seu grupo (domínico estrangeiro). Nós vemos que a mediana é de 19 para os carros domésticos (estrangeiros) e 24,5 para os carros estrangeiros (estrangeiros1). Os comandos de geração e recomeçamento abaixo recodam o mpg para o mpgfd com base na mediana do carro doméstico para os carros domésticos e com base na mediana do carro estrangeiro para os carros estrangeiros. Podemos verificar usando isso abaixo, e o valor recodificado mpgfd parece correto. Crie uma nova variável que seja comprimento dividido por 12. Mude os valores de uma variável existente chamada lenft. Recode mpg em mpg3. Tendo três categorias usando gerar e substituir se. Recode mpg em mpg3a. Tendo três categorias, 1 2 3, usando gerar e recodificar. Recode mpg em mpgfd. Tendo duas categorias, mas usando diferentes pontos de corte para carros estrangeiros e domésticos. O conteúdo deste site não deve ser interpretado como um endosso de qualquer site, livro ou produto de software específico da Universidade da Califórnia. SDLIM: módulo Stata para variáveis ​​de escala medida com uma escala de classificação limitada Ao solicitar uma correção, mencione Este identificador de itens: RePEc: boc: bocode: s457182. Veja informações gerais sobre como corrigir o material no RePEc. Para questões técnicas relativas a este item, ou para corrigir seus autores, títulos, resumo, informações bibliográficas ou de download, entre em contato: (Christopher F Baum) Se você é o autor deste item e ainda não está registrado no RePEc, encorajamos você a fazê-lo aqui . Isso permite vincular seu perfil a este item. Ele também permite que você aceite citações em potencial para este item sobre o qual não temos certeza. Se as referências faltam completamente, você pode adicioná-las usando este formulário. Se as referências completas listarem um item que está presente no RePEc, mas o sistema não ligou a ele, você pode ajudar com este formulário. Se você souber de itens faltantes citando este, você pode nos ajudar a criar esses links, adicionando as referências relevantes da mesma maneira que acima, para cada item referente. Se você é um autor registrado deste item, você também pode querer verificar a guia de citações em seu perfil, pois pode haver citações em espera de confirmação. Observe que as correções podem levar algumas semanas para filtrar os vários serviços do RePEc. Mais serviços Siga as séries, periódicos, autores amplificar Novos artigos por e-mail Inscreva-se para novas adições ao RePEc Inscrição do autor Perfis públicos para pesquisadores de Economia Vários rankings de pesquisa em campos relacionados à economia de amplificadores Quem foi um estudante de quem, usando RePEc RePEc Biblio Curated artigos amp Artigos sobre vários temas de economia Carregar seu papel para ser listado em RePEc e IDEIAS EconAcademics Blog agregador para pesquisa econômica Plágio Casos de plágio em Economia Papéis do mercado de trabalho RePEc série de papel de trabalho dedicada ao mercado de trabalho Fantasy League Imagine que você está no comando de uma economia Departamento de serviços da StL Fed Data, pesquisa, amplificador de aplicativos mais do St. Louis FedSDLIM: módulo Stata para variáveis ​​de escala medida com uma escala de classificação limitada Ao solicitar uma correção, mencione o identificador desses itens: RePEc: boc: bocode: s457182. Veja informações gerais sobre como corrigir o material no RePEc. Para questões técnicas relativas a este item, ou para corrigir seus autores, títulos, resumo, informações bibliográficas ou de download, entre em contato: (Christopher F Baum) Se você é o autor deste item e ainda não está registrado no RePEc, encorajamos você a fazê-lo aqui . Isso permite vincular seu perfil a este item. Ele também permite que você aceite citações em potencial para este item sobre o qual não temos certeza. Se as referências faltam completamente, você pode adicioná-las usando este formulário. Se as referências completas listarem um item que está presente no RePEc, mas o sistema não ligou a ele, você pode ajudar com este formulário. Se você souber de itens faltantes citando este, você pode nos ajudar a criar esses links, adicionando as referências relevantes da mesma maneira que acima, para cada item referente. Se você é um autor registrado deste item, você também pode querer verificar a guia de citações em seu perfil, pois pode haver citações em espera de confirmação. Observe que as correções podem levar algumas semanas para filtrar os vários serviços do RePEc. Mais serviços Siga as séries, periódicos, autores amplificar Novos artigos por e-mail Inscreva-se para novas adições ao RePEc Inscrição do autor Perfis públicos para pesquisadores de Economia Vários rankings de pesquisa em campos relacionados à economia de amplificadores Quem foi um estudante de quem, usando RePEc RePEc Biblio Curated artigos amp Artigos sobre vários temas de economia Carregar seu papel para ser listado em RePEc e IDEIAS EconAcademics Blog agregador para pesquisa econômica Plágio Casos de plágio em Economia Papéis do mercado de trabalho RePEc série de papel de trabalho dedicada ao mercado de trabalho Fantasy League Imagine que você está no comando de uma economia Serviços de departamento da StL Fed Data, pesquisa e aplicativos mais do St. Louis FedNOTICE: O grupo de consultoria estatística IDRE estará migrando o site para o WordPress CMS em fevereiro para facilitar a manutenção e criação de novos conteúdos. Algumas de nossas páginas antigas serão removidas ou arquivadas de modo que elas não serão mais mantidas. Vamos tentar manter os redirecionamentos para que os URLs antigos continuem a funcionar da melhor maneira possível. Bem-vindo ao Instituto de Pesquisas Digitais e Educação Ajude o Grupo de Consultoria Estatal, dando um presente Stata FAQ Como posso executar uma regressão por partes em Stata Say, que você quer analisar a relação entre o quanto uma criança fala no telefone e a idade Da criança. Você recebe uma amostra aleatória de 200 crianças e pergunta-lhes quantos anos tem e quantos minutos eles gastam conversando ao telefone. Você começa com um scatterplot dos dados como abaixo. Olhando para isso, você não está feliz com a não-linearidade que você vê nos dados, então tente adicionar um ajuste quadrático. Pensando nisso mais, você decide que você acha que a quantidade de tempo que as crianças falam no telefone muda dramaticamente aos 14 anos e que a inclinação pode mudar também a essa idade. Você acha que uma regressão por partes pode ter mais sentido, onde antes dos 14 anos há uma interceptação e uma inclinação linear, e após os 14 anos de idade, há uma intercepção diferente e uma inclinação linear diferente, tipo de como ilustrado abaixo com apenas o desenho à mão livre do que o Duas linhas de regressão podem parecer. Experimente 1: regressões separadas Para investigar isso, podemos executar duas regressões separadas, uma para antes dos 14 anos e uma para a idade de 14 anos. Podemos comparar os resultados desses dois modelos. Observe como as encostas parecem bastante diferentes para os dois grupos. No entanto, as intercepções não fazem muito sentido, já que são o tempo previsto conversando ao telefone quando alguém tem 0 anos de idade. Experimente 2: regressão separada com idade centrada em 14 Permite a idade de resscate (centro) subtraindo 14. Então, quando a idade é 0, isso realmente se refere a 14 anos. Observe como as encostas para os dois grupos permaneceram as mesmas, mas agora as interceptações (contras) são o tempo de conversação previsto aos 14 anos para os dois grupos. Podemos ver que aos 14 anos parece haver não apenas uma mudança na inclinação (de .682 a 3.62), mas também um salto na interceptação (de 17.6 para 25.8). Isso sugere que aos 14 anos, há um salto descontínuo no tempo, falando no telefone, bem como uma mudança na inclinação também. No entanto, isso é meramente sugestivo, devemos realmente testar isso em um modelo combinado. Experimente 3: modelo combinado, codificando para inclinação e interceptação separadas. Agora combinamos os dois modelos em um único modelo. Para fazer isso, precisamos criar algumas novas variáveis. Idade1 é a idade centrada em torno dos 14 anos, mas convertida em 0s após os 14 anos (representando o efeito da idade para crianças de até 14 anos). Idade2 é a idade centrada em torno dos 14 anos, mas convertida em 0s antes das 14 (representando o efeito da idade para os 14 anos de idade). Int1 é 1 antes dos 14 anos (representando a intercepção para antes de 14 anos de idade). Int2 é 1 após 14 anos (representando a intercepção para depois de 14 anos de idade). Isso pode ter sido confuso, então deixe-nos mostrar como essas variáveis ​​se parecem em uma tabela abaixo. Note-se que temos uma pessoa estranha que tem 13.9999 anos (muito muito perto de ser 14, mas não bastante). Esta pessoa será útil para ver o efeito do salto de passar de 14 a 14. Agora estamos prontos para executar nossa regressão combinada. Usamos a opção hascons porque o nosso modelo possui uma constante implícita, int1 plus int2, que somada a 1. Ao incluir esta opção, o teste geral do modelo é apropriado e o Stata não tenta incluir sua própria constante. Agora, obtenhamos os valores previstos (mostrados na tabela abaixo) e relacionamos esses com o significado dos coeficientes acima. A idade1 é a inclinação quando a idade é inferior a 14. Por exemplo, à medida que você passa de 5 a 6 anos, a conversa por telefone vai de 11,48 a 12,17, e isso equivale a 0,68 (com arredondamento). Age2 é a inclinação quando a idade é 14 ou superior. Por exemplo, ao passar de 15 a 16 anos, a conversa por telefone vai de 29,46 a 33,09, e isso equivale a 3,62 (com arredondamento). Int1 é o significado previsto para alguém que é apenas infinitamente próximo de ter 14 anos (mas não bastante 14). Note-se que, quando alguém é 13,9999, sua média prevista é a mesma que int1. Int2 é o significado previsto para alguém que acabou de completar 14 anos e note que 25,83 é o valor para int2 e é o valor para o valor previsto com exatamente a idade de 14. Aqui fazemos um gráfico dos resultados. Você pode querer testar se a diferença nas interceptações é 0, então podemos fazer isso abaixo. De fato, à medida que você faz 14 anos, você tem um quotjumpquot no tempo que você fala no telefone, por 8,2 minutos. Você também pode testar se as pistas são diferentes. A inclinação após 14 é maior em 2.94, e essa diferença (2.94) é significativamente diferente de 0.Tente 4: codificação alternativa, codificação para comparar intercepção e inclinação Esta é outra maneira de codificar este modelo. Note-se que incluímos idade 14 e idade2 para os dois termos de idade e contras e int2 para representar os valores de intercepção. Com esta codificação, age2 e int2 representam a mudança de menos de 14 para 14 ou mais. Usando este esquema de codificação, aqui está o significado dos coeficientes. A idade 14 é a inclinação quando a idade é inferior a 14. idade2 é a mudança na inclinação como resultado da idade de 14 ou superior (em comparação com menos de 14). Observe como esse valor de 2.94 corresponde ao comando lincom acima, comparando a inclinação após 14 para a inclinação antes de 14. contras é a média prevista para alguém que é apenas infinitamente próximo de 14 anos (mas não bastante 14). Int2 é o significado previsto para alguém que acabou de completar 14 anos menos a média prevista para alguém que é infinitamente próximo de 14 anos (o salto que ocorre aos 14 anos). Observe como isso corresponde ao resultado do comando lincom acima que testou a diferença nas interceptações. Como você pode ver, os coeficientes para age2 e int2 agora se concentram na mudança que resulta de tornar-se 14 anos. Como nós calculamos os valores previstos, chamando eles yhat2. Observe como os valores previstos são os mesmos para este modelo e o modelo anterior, porque os modelos são essencialmente os mesmos, eles são apenas parametrizados de forma diferente. Experimente 5: usando mkspline e obtenha codificação de inclinação separada. A Stata possui um comando de conveniência muito agradável para esses tipos de modelos, chamados de mkspline. Abaixo, usamos o comando para criar as variáveis ​​xage1 (idade anterior a 14) e xage2 (idade após 14). Em seguida, mostramos a codificação abaixo. Em seguida, corremos a regressão abaixo. Observe que o efeito para xage1 é a inclinação antes dos 14 anos e xage2 é a inclinação após a idade 14. O termo int2 corresponde ao salto nas linhas de regressão aos 14 anos. O valor para contra é a quantidade prevista de conversa para alguém que Tem zero anos de idade. Experimente 6: Usando mkspline e obtenha codificação para comparar as inclinações Repetimos os mesmos comandos de cima, mas use a opção marginal no comando mkspline e, desta vez, crie variáveis ​​chamadas yage1 e yage2. A codificação é mostrada abaixo. Observe que todos os coeficientes são iguais ao último modelo, exceto para yage2. Esse coeficiente agora é a mudança na inclinação após a idade de 14 até antes dos 14 anos (ou seja, 3.62 - .68 2.94). Codificado dessa maneira, testes de yage2 para diferenças nas encostas. Esta breve FAQ comparou diferentes formas de criar modelos de regressão por partes. Todos esses modelos são equivalentes, na medida em que o teste geral do modelo é exatamente o mesmo (sempre F (3, 196) 210.66) e todos eles geram os valores previstos. As diferenças na parametrização são meramente uma recapitulação das interceptações e encostas para os dois segmentos do modelo de regressão. Você pode escolher a estratégia de codificação que você mais gosta, mas note que você pode usar o lincom para combinar ou comparar coeficientes para formar comparações que não estavam presentes no modelo original. Enquanto o comando mkspline é muito conveniente, alguns podem preferir os esquemas de codificação manuais que ilustramos por causa da interpretação que eles fornecem em relação aos termos de intercepção. O conteúdo deste site não deve ser interpretado como um endosso de qualquer site, livro ou produto de software específico da Universidade da Califórnia.

No comments:

Post a Comment