Sunday, 8 October 2017

Categorizando Dados No Stata Forex


AVISO: O grupo de consultoria estatística IDRE estará migrando o site para o WordPress CMS em fevereiro para facilitar a manutenção e criação de novos conteúdos. Algumas de nossas páginas antigas serão removidas ou arquivadas de modo que elas não serão mais mantidas. Vamos tentar manter os redirecionamentos para que os URLs antigos continuem a funcionar da melhor maneira possível. Bem-vindo ao Instituto de Pesquisa e Educação Digital Ajudar o Grupo de Consultoria de Estatísticas dando um presente Stata FAQ Como posso recodificar variáveis ​​contínuas em grupos Pode haver momentos em que você deseja converter uma variável contínua em grupos. Por exemplo, você pode querer converter uma pontuação de leitura contínua que varie de 0 a 100 em 3 grupos (digamos baixo, médio e alto). Você pode usar egen com a função cut () para fazer isso de forma rápida e fácil, conforme ilustrado abaixo. Vamos ilustrar isso com o arquivo de dados hsb2 com uma variável chamada escrita que varia de 31 a 67. Podemos usar egen com a função cut () para criar uma variável chamada writecat que agrupa a variável escrever nas quatro categorias a seguir. 30 até (mas não incluindo) 40 40 até (mas não incluindo) 50 50 até (mas não incluindo) 60 60 até (mas não incluindo) 70 O comando da tabela abaixo é usado para verificar se os dados estão agrupados como nós esperamos. Podemos ver isso quando o writecat está na categoria mais baixa (30) que escreve intervalos de 31 a 39, e assim por diante, como esperamos, por exemplo, Os valores quando o gravador está na categoria 30 correspondem a escrever com valores de 30 até (mas não incluídos) 40. Aqui usamos o mesmo comando, mas nossa última categoria é de 50 a 60. Como você vê, ele gera um valor ausente porque Há uma série de valores que são 60 ou superiores e, portanto, fora do intervalo que especificamos. Isso mostra que, se houver valores fora do intervalo que você fornecer, será atribuído um valor faltando. Se usarmos a opção icodes, cut () criará códigos inteiros 0, 1, 2 e assim por diante. No exemplo abaixo, você pode ver que criou os códigos 0, 1, 2 e 3. Se você usa a opção de etiqueta (o que implica automaticamente icode), ele criará valores inteiros como acima, mas também criará rótulos de valor. Como você vê abaixo, a variável writecat4 é rotulada de 30 a 40-50 e 60-. Usamos a opção nolabel para suprimir a exibição das etiquetas de valor e você pode ver que a variável realmente está codificada 0, 1, 2 e 3. Se você preferir, você pode pedir corte () para escolher os pontos de corte para formar grupos com aproximadamente O mesmo número por grupo. Abaixo, solicitamos a criação de 4 (grosso modo) grupos de tamanho igual. Para obter mais informações, consulte o manual de ajuda ou referência sobre egen. O conteúdo deste site não deve ser interpretado como um endosso de qualquer site, livro ou produto de software da Universidade da Califórnia. NOTICE: O grupo de consultoria estatística IDRE estará migrando o site para o WordPress CMS em fevereiro para facilitar Manutenção e criação de novos conteúdos. Algumas de nossas páginas antigas serão removidas ou arquivadas de modo que elas não serão mais mantidas. Vamos tentar manter os redirecionamentos para que os URLs antigos continuem a funcionar da melhor maneira possível. Bem-vindo ao Instituto de Pesquisa e Educação Digital Ajudar o Grupo de Consultoria Stat ao oferecer um presente Módulo de Aprendizagem Stata Usando datas em Stata Este módulo mostrará como usar variáveis ​​de data, funções de data e formatos de exibição de data em Stata. Conversão de datas de dados brutos usando a função quotdate () Quot O truque para inserir datas em Stata é esquecer que são datas e tratá-las como seqüências de caracteres e depois convertê-las em uma variável de data Stata. Você pode ter os seguintes dados da data em seu arquivo de dados brutos. Você pode ler esses dados digitando: Usando o comando da lista, você pode ver que a informação da data foi lida corretamente no bday. Uma vez que bday é uma variável de string, você não pode fazer qualquer tipo de cálculo de data com ela até que você faça uma variável de data dela. Você pode gerar uma versão de data de bday usando a função date (). O exemplo abaixo cria uma variável de data chamada aniversário a partir da variável de caractere bday. A sintaxe é ligeiramente diferente dependendo da versão do Stata que você está usando. A diferença é na forma como o padrão é especificado. Em Stata 9, deve ser minúscula (por exemplo, quotdmyquot) e no Stata 10, deve ser maiúscula para o dia, o mês e o ano (por exemplo, quotDMYquot), mas em minúsculas se você deseja especificar horas, minutos ou segundos (por exemplo, quotDMYhmsquot) . Nossos dados estão no dia da ordem, mês, ano, então usamos quotDMYquot (ou quotdmyquot se você estiver usando o Stata 9) dentro do comando date (). (Salvo indicação em contrário, todos os outros comandos da Stata nesta página são os mesmos para as versões 9 e 10.) Na versão do Stata 9: no Stata versão 10: Dê uma olhada em bday e aniversário. Os valores para aniversário podem parecer confusos. O valor de aniversário para John é 0 eo valor de aniversário para Mark é -207. As datas são realmente armazenadas como o número de dias a partir de 1 de janeiro de 1960, o que é conveniente para o computador armazenar e executar cálculos de data, mas é difícil para você e para eu ler. Podemos dizer a Stata que o aniversário deve ser exibido usando o formato d para facilitar a leitura dos humanos. A função data () é muito flexível e pode manusear datas escritas de forma quase que simples. Por exemplo, considere o arquivo datas2.raw. Essas datas são confusas, mas são consistentes. Mesmo que os formatos pareçam diferentes, é sempre um mês de um ano do dia, separado por um delimitador (por exemplo, ponto de barras do espaço ou dash). Podemos tentar usar a sintaxe acima para ler nossas novas datas. Observe que, como discutido acima, para a versão 10 do Stata, a ordem da data é declarada em letras maiúsculas (ou seja, quotMDYquot) enquanto que para a versão 9 é declarada em todas as minúsculas (ou seja, quotmdyquot). A Stata conseguiu ler essas datas sem problema. Vamos tentar um conjunto ainda mais difícil de datas. Por exemplo, considere as datas em datas3.raw. Vamos tentar ler essas datas e ver como a Stata as lida. Mais uma vez, lembre-se de que, para as datas da versão 14 da Stata, são declaradas quotMDYquot, enquanto que para a versão 9 são declaradas quotmdyquot. Como você pode ver, a Stata conseguiu lidar com quase todos esses formatos de data louca. Ele foi capaz de lidar com Abr 12,1990, embora não existisse um delimitador entre o mês eo dia (Stata conseguiu descobrir que o mês era um personagem e o dia era um número). A única data que não funcionou foi Apr121990 e isso ocorre porque não havia delimitador entre o dia eo ano. Como você pode ver, a função date () pode lidar com qualquer data, desde que existam delimitadores que separam o mês, dia e ano. Em certos casos, a Stata pode ler todas as datas numéricas inseridas sem delimitadores, veja as datas de ajuda para obter mais informações. Conversão de datas de dados brutos usando a função mdy () Em alguns casos, você pode ter o mês, dia e ano armazenados como variáveis ​​numéricas em um conjunto de dados. Por exemplo, você pode ter os seguintes dados para datas de nascimento de datas4.raw. Você pode ler esses dados usando a seguinte sintaxe para criar uma variável separada por mês, dia e ano. Uma variável de data Stata pode ser criada usando a função mdy () como mostrado abaixo. Permite formatar o aniversário usando o formato d para que ele seja melhor. Considere os dados em datas5raw. Que é o mesmo que datas4.raw, exceto que apenas dois dígitos são usados ​​para significar o ano. Procuremos ler essas datas exatamente como lemos datas4.raw. Como você pode ver, os valores para aniversários estão faltando. Isso porque Stata assume que os anos eram literalmente 48, 60, 70 e 71 (não assume que são 1948, 1960, 1970 e 1971). Você pode forçar Stata a assumir que a parcela do século é 1900, adicionando 1900 ao ano, conforme mostrado abaixo (note que usamos substituir em vez de gerar desde que a idade da variável já existe). Cálculos com datas decorridas As variáveis ​​de data fazem cálculos que envolvem datas muito convenientes. Por exemplo, para calcular a idade de todos em 1 de janeiro de 2000, use simplesmente a seguinte conversão. Por favor, note que esta fórmula para a idade não funciona bem em períodos de tempo muito curtos. Por exemplo, a idade para uma criança em seu aniversário será menor do que uma devido ao uso de 365.25. Existem fórmulas que são mais exatas, mas também muito mais complexas. Aqui está um exemplo de cortesia de Dan Blanchette. Outras funções de data Dada uma variável de data, um pode ter o mês, dia e ano retornados separadamente se desejado, usando o mês (). Funções dia () e ano (), respectivamente. Se você gostaria de retornar o dia da semana para uma variável de data, use a função dow () (onde 0Sunday, 1Monday etc.). A função date () converte strings contendo datas para variáveis ​​de data. A sintaxe varia ligeiramente pela versão. Na versão do Stata 9: no Stata versão 10: a função mdy () leva três argumentos numéricos (mês, dia, ano) e os converte em uma variável de data. Você pode exibir os tempos decorridos como datas reais com formatos de exibição, como o formato d. Outras funções de data incluem o mês (). dia() . Ano (). E dow () funções. Para obter ajuda on-line com datas, digite as datas de ajuda na linha de comando. Para explicações mais detalhadas sobre como o Stata administra datas e funções de data, consulte o Guia do Usuário do Stata. O conteúdo deste site não deve ser interpretado como um endosso de qualquer site, livro ou produto de software específico da Universidade da Califórnia.

No comments:

Post a Comment