Tuesday 1 August 2017

Moving Average Frequency Response Matlab


GEOS 585A, Análise da série de horas aplicadas Telefone: (520) 621-3457 Fax: (520) 621-8229 Horário de atendimento Quarta-feira, 1: 30-5 p. M. (Envie um email para agendar reunião) Descrição do curso Ferramentas de análise nos domínios de tempo e frequência São introduzidos no contexto de séries temporais de amostra. Eu uso um conjunto de dados de séries temporais de amostra para ilustrar métodos e altero o conjunto de dados a cada semestre que o curso é oferecido. Este ano, o conjunto de dados da amostra vem de um projeto NSF sobre a variabilidade da neve na bacia do rio americano da Califórnia. Este conjunto de dados inclui cronologias de arvores de árvore, índices de clima, registros de fluxo e séries temporais de equivalentes de neve-água medidas em estações de snow-course. Você montará sua própria série de tempo para uso no curso. Estes podem ser do seu próprio projeto de pesquisa. Voltar ao Topo da página Este é um curso introdutório, com ênfase nos aspectos práticos da análise de séries temporais. Os métodos são introduzidos hierarquicamente - começando com terminologia e gráficos exploratórios, passando para estatística descritiva e terminando com procedimentos básicos de modelagem. Os tópicos incluem detrending, filtragem, modelagem autorregressiva, análise espectral e regressão. Você passou as duas primeiras semanas instalando o Matlab em seu laptop, obtendo uma introdução básica ao Matlab e montando seu conjunto de dados de séries temporais para o curso. Doze tópicos, ou lições são cobertas, cada uma é alocada por uma semana ou dois períodos de aula. Doze trabalhos de classe acompanham os tópicos. As atribuições consistem em aplicar métodos executando scripts Matlab pré-escritos (programas) em suas séries temporais e interpretando os resultados. O curso 3 créditos para estudantes no campus da Universidade do Arizona em Tucson e 1 crédito para estudantes on-line. Qualquer série de tempo com um incremento de tempo constante (por exemplo, dia, mês, ano) é um candidato para uso no curso. Exemplos são as medidas diárias de precipitação, fluxo total sazonal, temperatura média do verão, índices anuais de crescimento da árvore, índices de temperatura da superfície do mar e incremento de altura diária de um arbusto. Como resultado de seguir o curso, você deve: entender os conceitos básicos e a terminologia das séries temporais ser capazes de selecionar métodos de séries temporais adequados aos objetivos para avaliar a literatura científica aplicando os métodos da série de tempo abrangidos, melhorando a compreensão das propriedades das séries temporais de sua Próprio conjunto de dados, seja capaz de resumir de forma concisa os resultados da análise de séries temporais por escrito Pré-requisitos Um curso de estatísticas introdutórias Acesso a um computador portátil capaz de ter o Matlab instalado. Permissão do instrutor (estudantes de graduação e estudantes on-line) Outros Requisitos Se você estiver em uma Universidade de Aluno do Arizona (UA) no campus em Tucson, você tem acesso a Matlab e caixas de ferramentas necessárias através de uma licença de site UA como software sem custo. Nenhuma experiência prévia com Matlab é necessária e a programação de computadores não faz parte do curso. Se você é on-line, não no campus da UA, você poderá seguir o curso no semestre da primavera de 2017 como um iCourse. Você deve garantir que você tenha acesso ao Matlab e às caixas de ferramentas necessárias (veja abaixo) na sua localização. Acesso à internet. Não há troca de papel no curso. As notas e atribuições são trocadas eletronicamente e as atribuições completas são enviadas eletronicamente através do sistema Desire2Learn da Universidade do Arizona (D2L). Versão Matlab. Eu atualizo scripts e funções de vez em quando usando a versão atual da licença do Matlab, e as atualizações podem usar os recursos do Matlab não disponíveis em versões anteriores do Matlab. Para 2017, estou usando o Matlab Version 9.1.0.441655 (R2016b). Se você estiver usando uma versão anterior, verifique se é Matlab Release 2007b ou superior. Além do pacote principal da Matlab, são utilizadas quatro caixas de ferramentas: Estatísticas, Processamento de Sinais, Identificação do Sistema e Spline (versão Matlab 2010a ou anterior) ou Curve Fitting (Matlab Release 2010b ou posterior) Disponibilidade O curso é oferecido no Spring Semester Todos os outros anos (2015, 2017, etc.). Está aberto a estudantes de pós-graduação e também pode ser realizado por estudantes de graduação com permissão do instrutor. A inscrição de estudantes residentes da UA está limitada às 18 para o semestre da primavera de 2017. Um pequeno número de estudantes on-line também geralmente foi acomodado oferecendo o curso de várias maneiras. O caminho agora é o local do iCourse descrito acima. Voltar ao Topo da página Resumo do curso (lições) A ​​programação normalmente permite cerca de duas semanas para coletar dados e se familiarizar com o Matlab. Então, uma semana (dois períodos de aula) são dedicados a cada uma das 12 lições ou tópicos. A classe se reúne na terça e quinta-feira. Um novo tópico é apresentado na terça-feira, e continua na quinta-feira seguinte. As quintas-feiras terminam com uma atribuição e uma demonstração de execução do script em meus dados de amostra. A atribuição é devida (deve ser carregada por você para D2L) antes da aula na terça-feira seguinte. As primeiras 12 horas daquela terça-feira são utilizadas para auto-avaliação guiada e classificação da atribuição e transferência de atribuições avaliadas (D2L). Os 45 minutos restantes são usados ​​para apresentar o próximo tópico. Você deve levar seu laptop para a aula às terças. As 12 lições ou tópicos abordados no curso estão listados no esboço da classe. Espera-se que estudantes on-line sigam o mesmo cronograma de envio de trabalhos como estudantes residentes, mas não tenham acesso às palestras. As atribuições enviadas de estudantes on-line não são auto-avaliadas, mas são classificadas por mim. Os estudantes on-line devem ter acesso ao D2L para enviar trabalhos. Semestre de primavera de 2017. A classe se reúne duas vezes por semana para sessões de 75 minutos, das 9: 00-10: 15 da manhã, no quarto 424 (Sala de Conferências) do Edifício Bryant Bannister Tree Building (edifício 45B). O primeiro dia de aula é 12 de janeiro (Qui). O último dia da aula é 2 de maio (terça). Não há classe durante a semana de Spring Break (Mar 11-19). Você analisa dados de sua própria escolha nas atribuições da classe. Conforme indicado na visão geral do curso. Há muita flexibilidade na escolha de séries temporais. Vou disponibilizar um catálogo de séries de tempo adequadas, mas é melhor focar o curso em seu próprio conjunto de dados. A primeira tarefa envolve a execução de um script que armazena os dados e os metadados que você reuniu no arquivo mat, o formato nativo do Matlab. As atribuições subseqüentes desenham dados do arquivo mat para análise de séries temporais. Atribuições Os 12 tópicos são abordados sequencialmente ao longo do semestre, que cobre aproximadamente 15 semanas. Sobre as primeiras duas semanas (4-5 reuniões de classe) são usadas para algum material introdutório, decidindo e reunindo suas séries temporais e preparando Matlab em seu laptop. A cada semana, é dedicado a um dos 12 tópicos do curso. Cada tarefa consiste em ler um capítulo de notas, executando um script Matlab associado que aplica métodos selecionados de análise de séries temporais aos seus dados e redigindo sua interpretação dos resultados. As atribuições exigem compreensão dos tópicos da conferência, bem como a capacidade de usar o computador e o software. Você envia tarefas carregando-as para a D2L antes da aula de terça-feira, quando o próximo tópico for apresentado. A primeira meia hora dessa classe de terça-feira é usada para auto-avaliação guiada da tarefa, incluindo o upload de pdfs autodeterminados para D2L. Verifique uma ou mais das atribuições auto-classificadas a cada semana (por seleção aleatória) e pode alterar a nota. Para descobrir como acessar atribuições, clique nos arquivos de atribuição. As leituras consistem em notas de aula. Há doze conjuntos de arquivos de notas. pdf. Um para cada um dos tópicos do curso. Esses arquivos. pdf podem ser acessados ​​pela Web. Mais informações sobre os vários tópicos abordados no curso podem ser encontradas através das referências listadas no final de cada capítulo das notas da classe. As notas são baseadas inteiramente no desempenho das atribuições, cada uma das quais vale 10 pontos. Não há exames. O número total de pontos possíveis para os 12 tópicos é 12 x 10 120. Um grau de A exigiu 90-100 por cento dos possíveis pontos. Um grau de B requer 80-90 por cento. Um grau de C requer 70-80 por cento, e assim por diante. As notas são atribuídas por auto-avaliação guiada por uma rubrica apresentada por mim em sala de aula no contexto da minha análise do conjunto de dados da amostra. O número de pontos ganhos deve ser marcado no topo de cada atribuição graduada. Mar. A sua marcação da atribuição deve incluir anotação de quaisquer reduções com referência a um ponto de rubrica ilustrado na classe (por exemplo, -0.5, rp3) As atribuições deste semestre serão feitas na quinta-feira, e serão classificadas na aula na terça-feira seguinte. Isso dá 4 dias para concluir e fazer o upload da tarefa para D2L. D2L acompanha o tempo que a tarefa foi carregada, e nenhuma penalidade é avaliada, desde que seja carregada antes das 9:00 da manhã na terça-feira, fazemos a auto-avaliação. Se você tiver alguma necessidade agendada de estar fora da classe (por exemplo, atendimento em uma conferência), você é responsável por fazer o upload de sua tarefa antes das 9:00 da madrugada da terça-feira e por fazer o upload da versão auto-classificada às 10:15 da manhã. o mesmo dia. Em outras palavras, o horário é o mesmo que para os alunos que estão na aula. Se surgir uma emergência (por exemplo, você come a gripe) e não pode fazer a atribuição ou avaliação no cronograma, envie-me um e-mail e eu sugiro uma acomodação. Caso contrário, será aplicada uma penalidade de 5 pontos (metade do total de pontos disponíveis para o exercício). Introdução à série cronológica organizando dados para análise Uma série temporal é amplamente definida como qualquer série de medidas tomadas em momentos diferentes. Algumas categorias descritivas básicas de séries temporais são 1) longas versus curtas, 2) tempo-passo versus tempo-passo desigual, 3) discreto versus contínuo, 4) periódico versus aperiodic, 5) estacionário versus não estacionário e 6) univariante vs multivariante . Essas propriedades, bem como a sobreposição temporal de séries múltiplas, devem ser consideradas na seleção de um conjunto de dados para análise neste curso. Você analisará sua própria série temporal no curso. Os primeiros passos são selecionar essas séries e armazená-las em estruturas em um arquivo mat. A uniformidade no armazenamento no início é conveniente para esta classe, de modo que a atenção possa ser focada na compreensão de métodos de séries temporais em vez de código de computador de depuração para preparar os dados para análise. Uma estrutura é uma variável Matlab semelhante a um banco de dados em que o conteúdo é acessado por designadores de campos textuais. Uma estrutura pode armazenar dados de diferentes formas. Por exemplo, um campo pode ser uma matriz de séries temporais numéricas, outro pode ser o texto que descreve a fonte de dados, etc. Na primeira tarefa, você executará um script Matlab que lê suas séries temporais e metadados de arquivos de texto ascii que você prepara de antemão e Armazena os dados nas estruturas Matlab em um único arquivo mat. Nas tarefas subsequentes, você aplicará métodos de séries temporais aos dados executando scripts e funções do Matlab que carregam o arquivo mat e operam nessas estruturas. Selecione os dados de amostra a serem utilizados para atribuições durante o curso Leia: (1) Notas1.pdf, (2) Primeiros passos, acessível a partir do menu de ajuda do MATLAB Resposta: Execute o script geosa1.m e responda as perguntas listadas no arquivo em a1.pdf Como distinguir as categorias de séries temporais Como iniciar e sair MATLAB Como inserir comandos MATLAB no prompt de comando Como criar figuras na janela de figuras Como exportar figuras para o processador de texto Diferença entre scripts MATLAB e funções Como executar scripts e funções O Forma de uma variável de estrutura MATLAB Como aplicar o script geosa1.m para obter um conjunto de séries temporais e metadados em estruturas MATLAB A distribuição de probabilidade de uma série temporal descreve a probabilidade de uma observação cair em um intervalo de valores especificado. Uma distribuição de probabilidade empírica para uma série temporal pode ser feita classificando e classificando os valores da série. Quantiles e percentis são estatísticas úteis que podem ser tomadas diretamente da distribuição de probabilidade empírica. Muitos testes estatísticos paramétricos assumem que a série temporal é uma amostra de uma população com uma distribuição de probabilidade populacional específica. Muitas vezes, a população é considerada normal. Este capítulo apresenta algumas definições básicas, estatísticas e gráficos relacionados à distribuição de probabilidade. Além disso, um teste (teste de Lilliefors) é introduzido para testar se uma amostra vem de uma distribuição normal com média e variância não especificadas. Resposta: Execute o script geosa2.m e responda as perguntas listadas no arquivo em a2.pdf Definições de termos: séries temporais, estacionaria, densidade de probabilidade, função de distribuição, quantile, spread, localização, média, desvio padrão e distorção. Como interpretar o Gráfico mais valioso na análise de séries temporais - a série de séries temporais Como interpretar a trama de caixa, o histograma e o plano de probabilidade normal Parâmetros e forma da distribuição normal Teste de Lilliefors para a normalidade: descrição gráfica, premissas, hipóteses nulas e alternativas Advertência na interpretação de Níveis de significância de testes estatísticos quando séries temporais não aleatórias no tempo Como aplicar geosa2.m para verificar as propriedades de distribuição de uma série temporal e testar a série para a normalidade A autocorrelação refere-se à correlação de uma série temporal com seus próprios valores passados ​​e futuros. A autocorrelação também é chamada de correlação em atraso ou correlação em série. Que se refere à correlação entre membros de uma série de números organizados no tempo. A autocorrelação positiva pode ser considerada uma forma específica de persistência. Uma tendência para que um sistema permaneça no mesmo estado de uma observação para a próxima. Por exemplo, a probabilidade de amanhã estar chuvoso é maior se hoje estiver chuvoso do que se hoje estiver seco. As séries temporais geofísicas são frequentemente auto-correlacionadas devido a inércia ou processos de transição no sistema físico. Por exemplo, os sistemas de baixa pressão que evoluem lentamente e movendo-se na atmosfera podem conferir persistência às chuvas diárias. Ou a drenagem lenta das reservas de águas subterrâneas pode fornecer correlação com os sucessivos fluxos anuais de um rio. Ou fotosínteses armazenados podem conferir correlação a valores anuais sucessivos de índices de arvores. A autocorrelação complica a aplicação de testes estatísticos, reduzindo o número de observações independentes. A autocorrelação também pode complicar a identificação de covariância significativa ou correlação entre séries temporais (por exemplo, precipitação com uma série de arvores). A autocorrelação pode ser explorada para previsões: uma série de tempo autocorrelacionada é previsível, probabilisticamente, porque os valores futuros dependem dos valores atuais e passados. Três ferramentas para avaliar a autocorrelação de séries temporais são (1) o gráfico de séries temporais, (2) o diagrama de dispersão retardado e (3) a função de autocorrelação. Resposta: Execute o script geosa3.m e responda as perguntas listadas no arquivo em a3.pdf Definições: autocorrelação, persistência, correlação serial, função de autocorrelação (acf), função de autocovariância (acvf), tamanho de amostra efetivo Como reconhecer autocorrelação na série temporal Trama Como usar diagramas de dispersão retardados para avaliar a autocorrelação Como interpretar o acf gráfico Como ajustar o tamanho da amostra para autocorrelação Definição matemática da função de autocorrelação Termos que afetam a largura da banda de confiança calculada do acf A diferença entre um lado unilateral e dois Teste paralelo de autocorrelação significativa de lag-1 Como aplicar geos3.m para estudar a autocorrelação de uma série temporal O espectro de uma série temporal é a distribuição da variância da série como função de freqüência. O objetivo da análise espectral é estimar e estudar o espectro. O espectro não contém nenhuma informação nova além daquela na função de autocovariância (acvf), e de fato o espectro pode ser calculado matematicamente pela transformação do acvf. Mas o espectro e o acvf apresentam a informação sobre a variância da série temporal a partir de pontos de vista complementares. O acf resume informações no domínio do tempo e no espectro no domínio da freqüência. Resposta: Execute o script geosa4.m e responda as perguntas listadas no arquivo em a4.pdf Definições: freqüência, período, comprimento de onda, espectro, freqüência de Nyquist, freqüências de Fourier, largura de banda Razões para analisar um espectro Como interpretar um espectro plotado em termos de distribuição De variância A diferença entre um espectro e um espectro normalizado Definição da janela de desvio como usada na estimativa do espectro pelo método Blackman-Tukey Como a escolha da janela de atraso afeta a largura de banda e a variância do espectro estimado Como definir um espectro de ruído branco E espectro autorregressivo Como esboçar algumas formas espectrales típicas: ruído branco, auto - gressivo, quase-periódico, de baixa freqüência e alta freqüência Como aplicar o geosa4.m para analisar o espectro de uma série temporal pelo método Blackman-Tukey Autoregressive-Moving Os modelos de modelagem média (ARMA) da modelagem média (ARMA) são modelos matemáticos da persistência, ou autocorrelação, em uma série temporal. Os modelos ARMA são amplamente utilizados em hidrologia, dendrocronologia, econometria e outros campos. Existem vários motivos possíveis para ajustar os modelos ARMA aos dados. A modelagem pode contribuir para a compreensão do sistema físico, revelando algo sobre o processo físico que constrói a persistência na série. Por exemplo, um modelo simples de equilíbrio de água físico consistindo em termos de entrada de precipitação, evaporação, infiltração e armazenamento de água subterrânea pode mostrar uma série de fluxo que segue uma forma particular do modelo ARMA. Os modelos ARMA também podem ser usados ​​para prever o comportamento de uma série temporal de valores passados ​​sozinhos. Tal previsão pode ser usada como uma linha de base para avaliar a possível importância de outras variáveis ​​para o sistema. Os modelos ARMA são amplamente utilizados para a previsão de séries temporais econômicas e industriais. Os modelos ARMA também podem ser usados ​​para remover a persistência. Na dendrochronologia, por exemplo, a modelagem ARMA é aplicada rotineiramente para gerar cronogramas residuais de séries temporais de índice de largura do anel sem dependência de valores passados. Esta operação, chamada de pré-cofragmento, destina-se a remover a persistência biológica da série de modo a que o residual possa ser mais adequado para estudar a influência do clima e outros fatores ambientais externos sobre o crescimento da árvore. Resposta: Execute o script geosa5.m e responda as perguntas listadas no arquivo em a5.pdf A forma funcional dos modelos AR e ARMA mais simples Por que esses modelos são referidos como média autorregressiva ou móvel Os três passos na modelagem ARMA Os padrões de diagnóstico do Autocorrelação e funções de autocorrelação parcial para uma série temporal AR (1) Definição do erro de predição final (FPE) e como o FPE é usado para selecionar um melhor modelo de ARMA Definição da estatística de Portmanteau e como ele e o acf de resíduos podem ser Usado para avaliar se um modelo ARMA efetivamente modela a persistência em uma série. Como o princípio da parcimonia é aplicado na modelagem ARMA. Definição de pré-coifre. Como o pré-branqueamento afeta (1) a aparência de uma série temporal e (2) o espectro de uma série temporal Como aplicar geosa5.m ao modelo ARMA uma série temporal Análise espectral - método de periodograma suavizado Existem muitos métodos disponíveis para estimar o espectro de uma série temporal. Na lição 4, examinamos o método Blackman-Tukey, baseado na transformação de Fourier da função de autocovariância triturada alisada. O método de periodograma suavizado contorna a transformação do acf pela transformação direta de Fourier das séries temporais e computação do periodograma bruto, uma função introduzida pela primeira vez no século XIX para o estudo de séries temporais. O periodograma bruto é alisado aplicando combinações ou extensões de um ou mais filtros para produzir o espectro estimado. A suavidade, a resolução e a variação das estimativas espectrales são controladas pela escolha dos filtros. Um alisamento mais acentuado do periodograma bruto produz um espectro subjacente variável, ou contínuo nulo, contra o qual os picos espectrais podem ser testados quanto à significância. Esta abordagem é uma alternativa à especificação de uma forma funcional do contínuo nulo (por exemplo, espectro AR). Resposta: Execute o script geosa6.m e responda as perguntas listadas no arquivo em a6.pdf Definições: periodograma bruto, filtro Daniell, intervalo de filtro, continuidade nula continuidade, estabilidade e resolução do espectro afilado, preenchimento, vazamento Os quatro passos principais na estimativa O espectro pelo periodograma suavizado Como o efeito da escolha do filtro abrange a suavidade, estabilidade e resolução do espectro Como o contínuo nulo é usado no teste de significância de picos espectrales Como aplicar geosa6.m para estimar o espectro de um tempo Série pelo método de periodograma suavizado e teste para periodicidade em uma freqüência especificada A tendência em uma série temporal é uma mudança lenta e gradual em algumas propriedades da série em todo o intervalo sob investigação. A tendência é, por vezes, vagamente definida como uma mudança de longo prazo na média (Figura 7.1), mas também pode se referir a mudanças em outras propriedades estatísticas. Por exemplo, a série da largura do anel medido da árvore tem uma tendência de variância, bem como média (Figura 7.2). Na análise tradicional de séries temporais, uma série de tempo foi decomposta em componentes de tendência, sazonal ou periódica e flutuações irregulares, e as várias partes foram estudadas separadamente. As técnicas de análise modernas tratam frequentemente a série sem a decomposição de rotina, mas ainda é necessária uma consideração separada da tendência. Detrending é a operação estatística ou matemática da remoção da tendência da série. Detrending é frequentemente aplicado para remover um recurso pensado para distorcer ou obscurecer as relações de interesse. Na climatologia, por exemplo, uma tendência de temperatura devido ao aquecimento urbano pode obscurecer uma relação entre a nebulosidade e a temperatura do ar. Detrending também é usado às vezes como um passo de pré-processamento para preparar séries temporais para análise por métodos que assumem a estacionararia. Muitos métodos alternativos estão disponíveis para destruição. A tendência linear simples na média pode ser removida subtraindo uma linha reta de mínimos quadrados. Tendências mais complicadas podem exigir procedimentos diferentes. Por exemplo, o spline de suavização cúbica é comumente usado na dendrochronology para ajustar e remover a tendência do anel-largura que pode não ser linear, ou mesmo não monotonicamente aumentando ou diminuindo ao longo do tempo. Ao estudar e remover a tendência, é importante entender o efeito de destruição nas propriedades espectrales das séries temporais. Este efeito pode ser resumido pela resposta de freqüência da função detrending. Resposta: Execute o script geosa7.m e responda as perguntas listadas no arquivo em a7.pdf Definições: resposta de freqüência, spline, spline de suavização cúbica Prós e contras de diferença de relação vs diferença Interpretação de termos na equação para o parâmetro spline Como escolher um Spline interativamente da resposta de freqüência desejada Como o espectro é afetado por detrending Como medir a importância do componente de tendência em uma série temporal Como aplicar geosa7.m para escolher de forma interativa uma função detrinção de spline e detrastar uma série de tempo O espectro estimado de um tempo A série dá a distribuição de variância em função da frequência. Dependendo do propósito da análise, algumas freqüências podem ser de maior interesse do que outras, e pode ser útil reduzir a amplitude das variações em outras freqüências, filtrando-as estatisticamente antes de visualizar e analisar a série. Por exemplo, as variações de alta freqüência (ano-a-ano) em um registro de descarga calibrado de uma bacia hidrográfica podem ser relativamente sem importância para o abastecimento de água em uma bacia com grandes reservatórios que podem armazenar vários anos de escoamento anual médio. Onde as variações de baixa frequência são de interesse principal, é desejável suavizar o registro de descarga para eliminar ou reduzir as flutuações de curto período de tempo antes de usar o registro de alta para estudar a importância das variações climáticas para o abastecimento de água. O suavização é uma forma de filtragem que produz uma série de tempo em que a importância dos componentes espectrais em altas freqüências é reduzida. Os engenheiros elétricos chamam esse tipo de filtro de um filtro passa-baixa, porque as variações de baixa freqüência podem passar pelo filtro. Em um filtro passa-baixa, as ondas de baixa freqüência (período longo) são pouco afetadas pelo alisamento. Também é possível filtrar uma série de modo que as variações de baixa freqüência sejam reduzidas e as variações de alta freqüência não sejam afetadas. Este tipo de filtro é chamado de filtro passa-alto. Detrending é uma forma de filtragem de passagem alta: a linha de tendência ajustada rastreia as freqüências mais baixas, e os resíduos da linha de tendência tiveram essas baixas frequências removidas. Um terceiro tipo de filtragem, chamado de filtragem de passagem de banda, reduz ou filtra as freqüências alta e baixa e deixa alguma faixa de freqüência intermediária relativamente não afetada. Nesta lição, abordamos vários métodos de alisamento ou filtragem de passagem baixa. Nós já discutimos como a spline de suavização cúbica pode ser útil para este propósito. Quatro outros tipos de filtros são discutidos aqui: 1) média móvel simples, 2) binômio, 3) gaussiano e 4) janelas (método Hamming). As considerações na escolha de um tipo de filtro passa-baixa são a resposta de freqüência desejada e a extensão ou largura do filtro. Resposta: Execute o script geosa8.m e responda as perguntas listadas no arquivo em a8.pdf Definições: filtro, pesos de filtro, intervalo de filtro, filtro passa-baixa, filtro passa-alto, filtro passa-frequência resposta de freqüência de um filtro Como o gaussiano O filtro está relacionado à distribuição gaussiana Como criar um filtro binomial simples manualmente (sem o computador) Como descrever a função de resposta de freqüência em termos de um sistema com entrada e saída sinusoidais Como aplicar geosa8.m para projetar de forma interativa um binômio gaussiano Ou filtro de passagem baixa de Hamming-window para uma série temporal O coeficiente de correlação produto-momento de Pearson é provavelmente a estatística mais utilizada para resumir a relação entre duas variáveis. O significado estatístico e as advertências de interpretação do coeficiente de correlação aplicado às séries temporais são tópicos dessa lição. Sob certas suposições, a significância estatística de um coeficiente de correlação depende apenas do tamanho da amostra, definido como o número de observações independentes. Se as séries temporais forem autocorrelacionadas, um tamanho de amostra efetivo, menor do que o tamanho real da amostra, deve ser usado ao avaliar o significado. Relações transitórias ou espúrias podem produzir correlação significativa para alguns períodos e não para outros. A variação temporal da força da correlação linear pode ser examinada com gráficos de correlação calculados para uma janela deslizante. Mas, se muitos coeficientes de correlação forem avaliados simultaneamente, os intervalos de confiança devem ser ajustados (ajuste de Bonferroni) para compensar a maior probabilidade de observar algumas correlações elevadas onde não existe relação. A interpretação de correlações deslizantes também pode ser complicada por variações de tempo de variância e variância da série, pois a correlação deslizante reflete a covariação em termos de desvios padronizados de meios na janela de tempo de interesse, que podem diferir dos meios de longo prazo. Finalmente, deve-se enfatizar que o coeficiente de correlação de Pearson mede a força da relação linear. Scatterplots são úteis para verificar se o relacionamento é linear. Resposta: Execute o script geosa9.m ​​e responda as perguntas listadas no arquivo em a9.pdf Definição matemática do coeficiente de correlação Suposições e hipóteses para o teste de significância do coeficiente de correlação Como calcular o nível de significância do coeficiente de correlação e ajustar o nível de significância para autocorrelação em Séries temporais individuais Advertências à interpretação do coeficiente de correlação Ajuste de Bonferroni ao nível de correlação de significação em comparações múltiplas Inflação de variância do coeficiente de correlação estimado quando as séries temporais são autocorreladas Possíveis efeitos da transformação de dados na correlação Como interpretar tramas de correlações deslizantes Como aplicar geosa9. M para analisar correlações e correlações deslizantes entre pares de séries temporais Os relacionamentos retardados são característicos de muitos sistemas físicos naturais. A correlação retardada refere-se à correlação entre duas séries temporais deslocadas no tempo em relação à outra. A correlação retardada é importante no estudo da relação entre séries temporais por dois motivos. Primeiro, uma série pode ter uma resposta atrasada à outra série, ou talvez uma resposta atrasada a um estímulo comum que afeta ambas as séries. Em segundo lugar, a resposta de uma série à outra série ou um estímulo externo pode ser manchada no tempo, de modo que um estímulo restrito a uma observação provoca uma resposta em múltiplas observações. Por exemplo, devido ao armazenamento em reservatórios, geleiras, etc., o volume de descarga de um rio em um ano pode depender da precipitação nos vários anos anteriores. Ou devido a mudanças na densidade da coroa e armazenamento de fotosíntese, a largura de um anel de árvore em um ano pode depender do clima de vários anos anteriores. O coeficiente de correlação simples entre as duas séries corretamente alinhadas no tempo é inadequado para caracterizar o relacionamento nessas situações. Funções úteis que examinaremos como alternativa ao coeficiente de correlação simples são a função de correlação cruzada e a função de resposta ao impulso. A função de correlação cruzada é a correlação entre a série deslocada uma contra a outra como uma função do número de observações do deslocamento. Se a série individual for autocorrelada, a função de correlação cruzada estimada pode ser distorcida e enganosa como uma medida do relacionamento atrasado. Examinaremos duas abordagens para esclarecer o padrão de correlações cruzadas. Um é remover individualmente a persistência de, ou prewhite, a série antes da estimativa de correlação cruzada. Nesta abordagem, as duas séries são essencialmente consideradas em pé de igualdade. Uma alternativa é a abordagem de sistemas: visualize a série como um sistema linear dinâmico - uma série a entrada e a outra a saída - e estimar a função de resposta ao impulso. A função de resposta ao impulso é a resposta da saída nos tempos atuais e futuros para um pulso hipotético de entrada restrito ao tempo atual. Resposta: Execute o script geosa10.m e responda as perguntas listadas no arquivo em a. p.pdf Definições: função de covariância cruzada, função de correlação cruzada, função de resposta de impulso, correlação defasada, causal, linear Como a autocorrelação pode distorcer o padrão de correlações cruzadas and how prewhitening is used to clarify the pattern The distinction between the equal footing and systems approaches to lagged bivariate relationships Which types of situations the impulse response function (irf) is an appropriate tool How to represent the causal system treated by the irf in a flow diagram How to apply geos10.m to analyze the lagged cross-correlation structure of aa pair of time series Multiple linear regression Multiple linear regression (MLR) is a method used to model the linear relationship between a dependent variable and one or more independent variables. The dependent variable is sometimes also called the predictand, and the independent variables the predictors. MLR is based on least squares: the model is fit such that the sum-of-squares of differences of observed and predicted values is minimized. MLR is probably the most widely used method in dendroclimatology for developing models to reconstruct climate variables from tree-ring series. Typically, a climatic variable is defined as the predictand and tree-ring variables from one or more sites are defined as predictors. The model is fit to a period -- the calibration period -- for which climatic and tree-ring data overlap. In the process of fitting, or estimating, the model, statistics are computed that summarize the accuracy of the regression model for the calibration period. The performance of the model on data not used to fit the model is usually checked in some way by a process called validation. Finally, tree-ring data from before the calibration period are substituted into the prediction equation to get a reconstruction of the predictand. The reconstruction is a prediction in the sense that the regression model is applied to generate estimates of the predictand variable outside the period used to fit the data. The uncertainty in the reconstruction is summarized by confidence intervals, which can be computed by various alternative ways. Answer: Run script geosa11.m (Part 1) and answer questions listed in the file in a11.pdf The equation for the MLR model Assumptions for the MLR model Definitions of MLR statistics: coefficient of determination, sums-of-squares terms, overall-F for the regression equation, standard error of the estimate, adjusted R-squared, pool of potential predictors The steps in an analysis of residuals How to apply geosa11.m (part 1) to fit a MLR regression model to predict one variable from a set of several predictor variables Validating the regression model Regression R-squared, even if adjusted for loss of degrees of freedom due to the number of predictors in the model, can give a misleading, overly optimistic view of accuracy of prediction when the model is applied outside the calibration period. Application outside the calibration period is the rule rather than the exception in dendroclimatology. The calibration-period statistics are typically biased because the model is tuned for maximum agreement in the calibration period. Sometimes too large a pool of potential predictors is used in automated procedures to select final predictors. Another possible problem is that the calibration period itself may be anomalous in terms of the relationships between the variables: modeled relationships may hold up for some periods of time but not for others. It is advisable therefore to validate the regression model by testing the model on data not used to fit the model. Several approaches to validation are available. Among these are cross-validation and split-sample validation. In cross-validation, a series of regression models is fit, each time deleting a different observation from the calibration set and using the model to predict the predictand for the deleted observation. The merged series of predictions for deleted observations is then checked for accuracy against the observed data. In split-sample calibration, the model is fit to some portion of the data (say, the second half), and accuracy is measured on the predictions for the other half of the data. The calibration and validation periods are then exchanged and the process repeated. In any regression problem it is also important to keep in mind that modeled relationships may not be valid for periods when the predictors are outside their ranges for the calibration period: the multivariate distribution of the predictors for some observations outside the calibration period may have no analog in the calibration period. The distinction of predictions as extrapolations versus interpolations is useful in flagging such occurrences. Answer: Run script geosa11.m (Part 2) and answer questions listed in the file in a12.pdf Definitions: validation, cross-validation, split-sample validation, mean square error (MSE), root-mean-square error (RMSE) standard error of prediction, PRESS statistic, hat matrix, extrapolation vs interpolation Advantages of cross-validation over alternative validation methods How to apply geosa11.m (part 2) for cross-validated MLR modeling of the relationship between a predictand and predictors, including generation of a reconstruction and confidence bands Downloading Files -- tsfiles. zip -- not yet updated for Spring Semester 2017 The Matlab class scripts and user-written functions are zipped in a downloadable file called tsfiles. zip. To get the files, first create an empty directory on your computer. This is where you will store all functions, scripts and data used in the course. Click on tsfiles. zip to download the zip file to that directory and unzip it there. When you run matlab, be sure that directory is your current matlab working directory. Powerpoint lecture outlines miscellaneous files. Downloadable file other. zip has miscellaneous files used in lectures. Included are Matlab demo scripts, sample data files, user-written functions used by demo scripts, and powerpoint presentations, as pdfs (lect1a. pdf, lect1b. pdf, etc.) used in on-campus lectures. I update other. zip over the semester, and add the presentation for the current lecture within a couple of days after that lecture is given. To run the Matlab scripts for the assignments, you must have your data, the class scripts, and the user-written Matlab functions called by the scripts in a single directory on your computer. The name of this directory is unimportant. Under Windows, it might be something like C:geos585a. The functions and scripts provided for the course should not require any tailoring, but some changes can be made for convenience. For example, scripts and functions will typically prompt you for the name of your input data file and present Spring17 as the default. That is because Ive stored the sample data in Spring17.mat. If you want to avoid having to type over Spring17 with the name of your own data file each time you run the script, edit the matlab script with the Matlab editordebugger to change one line. In the editor, search for the string Spring17 and replace it with the name of your. mat storage file (e. g. Smith2017), then be sure to re-save the edited script. Dynamic Systems Lab Week 1 (112) - whats this all about Most engineering problems involve some kind of dynamics. This could be something obvious like determining the optimal trajectory of a space ship, or predicting the surf in Hawaii. It could also be less obvious (visible), for example determining temperature gradients in liquids or stressed-induced structural changes of materials. To be the most efficient, engineers and scientists usually follow a structured approach to solve a problem. Take a look at the chart below: The goal of ME402 is to introduce you to some of the most crucial tools and approaches of scientific problem solving: Data Acquisition Data Analysis Modeling Writing (Documentation) What am I suppose to do now Follow the instructions below The goal of this first lab exercise is to provide a first experience with making measurements with a computer. In particular, we will use both a multimeter and the MMC analog-to-digital converter to read a voltage (or two). This is supposed to be a short exercise. Take your time Getting oriented to these tools will make your future labs much more productive. Part 1: Analog-to-Digital (AD) Setup and a simple test with a battery. (Note: you can find a pdf (MMC 1408FS DAQ Setup for ME 402) of the instructions below on the Resources page of this website link ) Measurement Computing DAQ Setup The following instructions are intended to help you setup the Measurement Computing (MCC) USB-1408FS data acquisition hardware and software. More manuals for the hardware and software are available on the course website on the Equipment Resources page link. 1. Software and Driver Verification The MCC should be installed on your lab PC (on the Windows side). To verify that the software is installed: Go to the Start Menu - Measurement Computing Verify that there are two applications in this folder: Instacal and TracerDAQ If this software is not installed on your system you will need to install the MCC software tools before going further. See the course instructor. 2. Connecting the USB-1408FS Hardware and Verifying Install with InstaCal After you have installed the software, connect the USB-1408FS via a USB cable. The LED light on the DAQ should be on and you may here a sound from the PC. Open the InstaCal software to check that the DAQ board is installed and to configure the DAQ You should see something similar to 1. Click on the Board 0 USB-1408FS to highlight the board. Then go to Install-Configure This should open a dialog box (also shown in 1) to configure the board for differential or single-ended input. Make sure that differential input is selected. You may use the Test functionality in InstaCal to determine if there are any hardware problems, but for now you can close InstaCal. More details are available in the USB-1408FS Users Guide on the Reference page. 3. Acquiring Data using the TracerDAQ - Strip Chart Application Start the TracerDAQ application. Then select the Strip Chart option and click the Run button. Configure the DAQ board: Go to Edit-DAQ Hardware Settings Here you can select the mapping between the DAQ hardware channels (analog input) and the channels displayed on the Strip Chart. You can also select the voltage range for the input. You will want to make sure that the voltage range is large enough to bound your anticipated input. Go to Edit-Scan RateTrigger settings to specify the sample rate and the time of acquisition. Set the Acquire Data for time for the maximum time you would like to collect data you can always manually stop acquisition early. To start collecting data select the play button in the top-left of the window. The acquisition will stop automatically after the specified amount of time, or you may stop the acquisition using the stop button. To save the acquired data, go to File-Save As. Select an appropriate location to save the file and an appropriate file name. In the Save as type: drop down box select either (.txt) or (.csv) file types By saving the data in text (txt) or comma-separated-value (csv) formats we can easily import the data into MATLAB. Separate instructions for importing data into MATLAB are available on the course website. Some of the details about the Strip Chart application that you may want to read about in the Users Guide are scaling of the axes, controlling the display properties (colors, etc.) and using the strip chart markers to make measurements. 4. Connecting Signals to the DAQ The electrical connections are described in the pin-out diagram on page 14 of the USB-1408FS Users Guide. In general we will be using differential analog input on channel 0. The pertinent connections are Pin 1: Channel 0 Hi (typically connected to the signal) Pin 2: Channel 0 Lo (typically connected to ground) Pin 3: Ground (can be connected to Pin 2 if necessary) For more information on signal connections see the online document for MCC link. 5. Verification One simple test you can do to verify that your DAQ is working properly is to measure a known battery voltage using the DAQ. First, acquire data with no battery connected and verify that the voltage is near zero. Use a battery with wire leads (2 AAs or a 9V). Check the battery voltage with a multimeter Connect the battery to the DAQ: the neg. terminal goes to Ch 0 Lo (Pin 2) and the pos. terminal connects to Ch 0 Hi (Pin 1). Again acquire data and verify that the DAQ measured voltage is the same voltage you measured with the multimeter. Part 2: Connect a Potentiometer to the DAQ Here is an image of the connections we will make to the AD converter. We will use the GND and PC 5V pins to supply a 5 V voltage (Vout). You should measure the variable voltage, 0--5 V, from the potentiometer wiper (V0in). 1. Setup and Data Acquisition Connect the potentiometer to the AD. Take a look at the picture below. If the shaft of the potentiometer is facing up and the 3 terminals are facing you, the ground will be on your left hand side, the input to the potentiometer will be on the right, and the output is in the middle. Now, connect the potentiometer like this: Make sure you understand the setup. Setup the Strip Chart application with the following settings: Edit-Channel Settings. Number of channels 1 (You can change the color of the channel display if you like.) Edit-DAQ Hardware Settings. Set the channel to corresponding hardware channes on the USB device (e. g. CH0). Set the DAQ range for each channel to - 5 V Edit-Scan RateTrigger Settings. Scan Rate 150 Hz Aquire data for 30 seconds Hit the play button in the Strip Chart application to aquire data. Try to simulate a sine-wave with the potentiometer output. This is a good chance to familiarize youself with the Strip Chart settings. The display settings (autoscale, etc.) are a bit confusing, but play with them to understand what your are seeing in the software. Once you have a 30 second run that you are happy with, save the data as a file called pot. txt in the folder lab0 on the desktop of your PC. 2. Data Analysis using MATLAB For data display and processing well be using MATLAB. To display the voltage measurements you aquired follow these steps: Go to the MATLAB References Page and download the zip archive called importStripChart. zip link. Extract the files form this zip archive and put the files in your lab0 folder on the desktop. (It is important that the importStripChartData. m file be in the same directory as the data you acquired) Open MATLAB on your PC. Open the example program importexample. m and run the example. Now save the example as a new program called lab0graph. m Edit the program lab0graph. m so that it displays the data you aquired for the potentiometer test above. You will need to edit the line datavec1,timevec1,Ts importStripChartData(lab1run1.txt) By changing the name of the file from lab1run1.txt to pot. txt you will be able to use the program to import the data you just collected. Part 3: Deliverables Before you leave the lab, show your MATLAB and Strip Chart graphs to the instructor. Assignments due next week (Thu 119 before class) 1. Reading Read Textbook, Ch1 and Ch 2. Download textbook Download and read the LM35DT Temperature sensor datasheet from the Resources page link 2. Textbook Exercises To be prepared for the upcoming lab next week, each student should complete and submit the following textbook exercises: 1.1 1.2 1.3 1.5 2.4 (Use MATLAB. The example programs from the book can be download from the MATLAB resources page link .) 2.5 2.9 Important note: The pre-lab assignment deliverables should be put into a single document and submitted via Laulima following the electronic submission guidelines link. Also, bring a copy of your work to lab. We will go over the results. (Late assignments will not be accepted.) Week 2 (119) - check back soon

No comments:

Post a Comment