O que é Histograma? Quando utilizar? Como construir?

Histograma
18 de maio de 2020
Última modificação: 22 de julho de 2020

Autor: FM2S
Categorias: Análise de dados, Blog, Ferramentas da Qualidade, Melhoria de Processos

O que é um histograma?

Um histograma é um gráfico de frequência que tem como objetivo ilustrar como uma determinada amostra ou população de dados está distribuída. Ele, assim como o dot-plot, mede quantas vezes temos determinado valor dentro dessa nossa distribuição de dados. O histograma é inclusive uma das 7 ferramentas da qualidade, que nos ajudam a controlar processos tanto na indústria como no setor de serviços.

Antes ensinarmos como elaborar um histograma, faremos um breve comentário sobre a sua utilização na análise de dados, no controle da qualidade e na melhoria de processos.

 

Dica: Adquira nosso curso de Histograma clicando AQUI.

Quando utilizar um histograma?

Dependendo do tipo de dado que estamos trabalhando ou do problema que queremos resolver, usamos uma ferramenta diferente. Assim, o primeiro passo para desenhar um histograma ou começar qualquer análise é sempre coletar dados.

Os dados de um indicador de interesse para a qualidade podem ser divididos em:

  • Classificação (qualitativos): os resultados possíveis serão apenas afirmações ou negações, como peça defeituosa ou não defeituosa, entrega atrasada ou não atrasada, cliente satisfeito ou insatisfeito;
  • Contagem: os resultados são números inteiros. por exemplo, número de riscos em uma peça, número de acidentes no mês;
  • Contínuos: os resultados podem ser quaisquer números dentro de um intervalo, ou seja, peso, comprimento, gasto mensal, etc.

Depois de coletá-los, a primeira atividade visa ao entendimento, uma vez que nosso cérebro não é preparado para compreender um extenso conjunto de dados. É aqui que entra o histograma, pois permitirá a obtenção das seguintes informações sobre o nosso processo:

  • Centralidade: qual é o centro de distribuição? Onde é esperado que esteja a maioria das observações?
  • Amplitude: a distribuição normalmente contém observações entre quais valores? Qual é o ponto de máximo e o ponto de mínimo?
  • Simetria: será que devemos esperar a mesma frequência de pontos com valor alto e com valor baixo? Será que o processo é simétrico ou valores mais altos são mais raros?

Como construir um histograma?

Para construir um histograma, dividimos a amplitude dos dados em intervalos, preferencialmente de tamanhos iguais, e contamos o número de observações que estão em cada um dos intervalos. A escolha desses intervalos é crítica, mas qualquer software que seja capaz de produzir um histograma, como o Minitab, que ensinamos em nosso curso de Green Belt, possui algoritmos que realizam o cálculo de maneira a permitir a melhor visualização possível dos dados.

Exemplo

Para estudar o comportamento das vendas, um administrador coleta informações sobre o número de itens vendidos nos últimos 30 dias e constrói um histograma com o auxílio do Minitab. Com esse gráfico, ele percebeu que suas vendas variavam entre 28 e 52 unidades e na maioria dos dias ele vendia em torno de 40.

histograma

Figura 1: histograma do número de vendas

Outra maneira de enxergar a distribuição dos dados é o dot-plot, no qual cada ponto no gráfico representa uma observação.

HistogramaFigura 2: dot-plot do número de vendas.

Neste exemplo, ao analisar o histograma e também ao observar o dot-plot, é possível inferir que:

  • Centralidade: na maioria dos dias, vendemos 38 unidades em média.
  • Amplitude: há dias ruins, em que vendemos cerca de 27 unidades, e dias muito bons, nos quais as vendas podem chegar a até 52 unidades!
  • Simetria: o processo parece bem simétrico, o que significa que devemos esperar a mesma quantidade de dias bons e de dias ruins.

O que é um Diagrama de Ramos e Folhas?

Um enfoque alternativo para o histograma clássico é o Diagrama de Ramo e Folhas. A ideia básica dessa ferramenta é a mesma do histograma, visto que os dados são sub agrupados em subconjuntos contíguos de dados. No entanto, o Diagrama de Ramo e Folhas tem diversas vantagens em relação ao histograma, como a maior rapidez e facilidade de elaboração sem o auxílio de softwares. Além disso, os dados originais podem ser extraídos do Diagrama de Ramo e Folha, enquanto que em um histograma, com intervalos de classe, os dados originais são perdidos na construção.

Essa alternativa ao histograma é construída ao escolher primeiro o nível do ramo, o qual, usualmente, é uma ordem de magnitude maior do que a resolução dos dados originais, mas pode variar.

Quais são as aplicações de um histograma?

Histogramas e Diagramas de Ramo e Folhas podem ser úteis para responder às seguintes perguntas:

  • Quão ampla é a dispersão no conjunto de dados?
  • O conjunto de dados é simétrico?
  • Qual é o valor mais comum?
  • Existe mais de um pico?
  • Existem valores isolados no conjunto de dados?
  • Qual é a dispersão relativa à meta e às especificações?
  • Existe uma tendência de certos valores estarem presentes ou ausentes?

Nota importante: Um histograma não pode efetivamente responder às questões listadas acima se for usado isoladamente. É necessário um gráfico de controle para conseguir compreender a estabilidade do processo.

Essa ferramenta pode ser usada para ajudar a detectar se seus fornecedores estão empregando ou não a inspeção. Quando um gráfico de frequência exibe bordas “quadradas”, é provável que algum tipo de inspeção e ordenação esteja sendo aplicado ao processo.

Além disso, também são úteis para mostrar o efeito de uma mudança em um processo, construindo-se histogramas com dados tanto de antes quanto de depois da implementação da mudança do processo.

Como aplicar o histograma no dia a dia?

Veja uma aula do Green Belt Online sobre Histograma.

Quais os cuidados para se elaborar um Histograma?

Um ponto negativo do histograma, quando falamos de análise de dados, é que ele é uma medida estática, ou seja, não leva o tempo em consideração. Por exemplo, eu não sei se todos os dias bons aconteceram na mesma época ou se eles estão dispersos aleatoriamente no processo.

Muitas vezes, ter essa informação sobre o período é crucial. Imagine que todos os dias bons aconteceram em uma semana, na qual o administrador estava com uma campanha de marketing em andamento. Ele poderia dizer, com certeza, que a campanha dele foi boa! Da mesma maneira, se todo os dias ruins também tivessem acontecido em uma semana mais fria, ele também entenderia melhor o que impacta nas vendas dele.

Ao fazer análises como essa, olhando como os dados se comportam ao longo do tempo, podemos procurar por causas comuns e causas especiais de variação. Várias ferramentas nos ajudam com essa análise, como o gráfico de tendência e o gráfico de controle ou controle estatístico do processo.

Se você quer saber mais como fazer essas análises, pode começar já fazendo nosso curso online de White Belt gratuitamente.

Deixe seu comentário

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *