--- title: stats keywords: fastai sidebar: home_sidebar summary: "Módulo que contém os algoritmos para detecção de anomalias em dados univariados." description: "Módulo que contém os algoritmos para detecção de anomalias em dados univariados." ---
{% raw %}
{% endraw %}

Pré-requisitos

{% raw %}
{% endraw %}

MAD - Robust ZScore

Para detecção de anomalias o Zscore Robusto é mais adequado que o Zscore padrão, uma vez que a media pode ser fortemente influenciada por outliers.

{% raw %}
{% endraw %} {% raw %}

class MAD[source]

MAD(only_low_values=False)

classe responsavel por implemetar zscore robusto para detecção de anomalias.

{% endraw %} {% raw %}

MAD.fit[source]

MAD.fit(x)

Calcula os parametros do Zscore Robusto(Median/MAD) para os valores de x

{% endraw %} {% raw %}

MAD.predict[source]

MAD.predict(x, m=3.0)

retorna se os valores de x são outliers

{% endraw %} {% raw %}

MAD.fit_predict[source]

MAD.fit_predict(x, m=3.0)

Calcula os parametros e retorno os valores de x que são outliers

{% endraw %} {% raw %}

MAD.decision_function[source]

MAD.decision_function(x)

retorna se os valores de mad para cada valor em x

{% endraw %}

Uso

{% raw %}
x = np.random.randn(1000)
x[:5]
array([-0.16827292,  0.7966477 , -0.61079429,  0.15528615,  0.70016939])
{% endraw %} {% raw %}
mad = MAD()
mad.fit_predict(x)
array([-3.26114306, -3.46102532,  3.83808166, -3.06892246, -3.14646764])
{% endraw %} {% raw %}
mad = MAD(only_low_values=True)
mad.fit_predict(x)
array([-3.26114306, -3.46102532, -3.06892246, -3.14646764])
{% endraw %}

Tukey

{% raw %}
{% endraw %} {% raw %}

class Tukey[source]

Tukey(only_low_values=False)

classe responsavel por implemetar Tukey Method para detecção de anomalias.

{% endraw %} {% raw %}

Tukey.fit[source]

Tukey.fit(x)

Calcula os parametros do Tukey(Q1,Q2,Q3) para os valores de x

{% endraw %} {% raw %}

Tukey.predict[source]

Tukey.predict(x)

retorna se os valores de x são outliers

{% endraw %} {% raw %}

Tukey.decision_function[source]

Tukey.decision_function(x)

retorna o score para os valores de x

{% endraw %}

Tukey Uso

{% raw %}
x = np.arange(10)

tu = Tukey()
tu.fit_predict(x)
array([], dtype=int64)
{% endraw %} {% raw %}
x[0] = -100
x[9] = 100

tu = Tukey()
tu.fit_predict(x)
array([-100,  100])
{% endraw %} {% raw %}
tu = Tukey(only_low_values=True)
tu.fit_predict(x)
array([-100])
{% endraw %}