aibox.nlp.pipelines.cohmetrix_extratrees_classification

Pipeline de classificação utilizando o CohMetrix com um ensemble de Extremely Randomized Trees.

Classes

CohMetrixExtraTreesClassification([...])

Pipeline com características do CohMetrix e ExtraTreesClassifier.

class aibox.nlp.pipelines.cohmetrix_extratrees_classification.CohMetrixExtraTreesClassification(random_state: int | None = None, etree_config: dict | None = None)[código-fonte]

Base: Pipeline

Pipeline com características do CohMetrix e ExtraTreesClassifier.

Parâmetros:
  • random_state (int | None) – seed.

  • etree_config (dict) – configuração pro classificador.

property estimator: Estimator

Retorna o estimador utilizado nessa pipeline.

Retorna:

estimador dessa pipeline.

fit(X: list[str] | ndarray[str_], y: list[int] | list[float] | ndarray[int32] | ndarray[float32] | Tensor, **kwargs) None

Realiza o treinamento da pipeline utilizando as entradas X com os targets y.

Parâmetros:
  • X (list[str] | ndarray[str_]) – array-like de strings com formato (n_samples, <any>).

  • y (list[int] | list[float] | ndarray[int32] | ndarray[float32] | Tensor) – array-like com formato (n_samples,).

  • **kwargs – configurações estras para o estimador ou vetorizador.

Tipo de retorno:

None

property name: str

Retorna o nome dessa pipeline.

Retorna:

nome da pipeline.

postprocessing(y: ndarray) ndarray

Método de pós-processamento da pipeline.

Parâmetros:

y (np.ndarray) – array-like com formato (n_samples,).

Retorna:

array com mesmo formato após função de pós-processamento.

Tipo de retorno:

ndarray

predict(X: list[str] | ndarray[str_], **kwargs) ndarray

Realiza a predição utilizando os parâmetros atuais da pipeline.

O comportamento desse método não é definido caso seja chamado antes do treinamento (i.e., fit()).

Parâmetros:
  • X (list[str] | ndarray[str_]) – array-like de strings com formato (n_samples, <any>).

  • **kwargs – configurações estras para o estimador ou vetorizador.

Retorna:

array com as predições para cada amostra.

Tipo de retorno:

np.ndarray

property vectorizer: Vectorizer

Retorna o vetorizador dessa pipeline.

Retorna:

vetorizador dessa pipeline.

Tipo de retorno:

Vectorizer