aibox.nlp.estimators.generic.transformers

Estimador baseado na arquitetura Transformer.

Classes

TransformerEstimator(kind[, model_name, ...])

Estimador genérico baseado na arquitetura Transformers utilizando o huggingface.

class aibox.nlp.estimators.generic.transformers.TransformerEstimator(kind: Literal['classifier', 'regressor'], model_name: str = 'neuralmind/bert-base-portuguese-cased', max_seq_len: int = 512, epochs: int = 2, batch_size: int = 8, learning_rate: float = 5e-05, random_state: int | None = None, do_lower_case: bool = False, regression_ensure_bounds: bool = False)[código-fonte]

Base: Estimator

Estimador genérico baseado na arquitetura Transformers utilizando o huggingface.

Parâmetros:
  • kind (Literal['classifier', 'regressor']) – se é uma rede de classificação ou regressão.

  • model_name (str) – nome do modelo base. Defaults to “neuralmind/bert-base-portuguese-cased”.

  • max_seq_len (int) – tamanho máximo de uma sentença ( é realizado truncamento).

  • epochs (int) – quantidade de épocas de treinamento.

  • batch_size (int) – tamanho do batch utilizado para treino e avaliação.

  • learning_rate (float) – taxa de aprendizado passada para o otimizador.

  • random_state (int | None) – seed.

  • do_lower_case (bool) – se a tokenização deve converter para caixa baixa.

  • regression_ensure_bounds (bool) – caso rede seja de regressão, se os valores preditos devem ser clipados para o máximo e mínimo encontrados durante treinamento.

predict(X: list[int] | list[float] | ndarray[int32] | ndarray[float32] | Tensor | list[str] | ndarray[str_], **kwargs) ndarray[código-fonte]

Realiza a predição utilizando os parâmetros atuais do modelo.

Parâmetros:
Retorna:

predições com shape (n_samples,).

Tipo de retorno:

ndarray

fit(X: list[int] | list[float] | ndarray[int32] | ndarray[float32] | Tensor | list[str] | ndarray[str_], y: list[int] | list[float] | ndarray[int32] | ndarray[float32] | Tensor, **kwargs)[código-fonte]

Realiza o treinamento do estimador.

Parâmetros:
property hyperparameters: dict

Hiper-parâmetros do modelo. Inclui a seed randômica. Estrutura do dicionário varia entre diferentes estimadores.

Retorna:

dicionário de hiper-parâmetros.

property params: dict

Retorna um dicionário com os parâmetros para esse estimador.

Os parâmetros retornados descrevem totalmente o estado do modelo (e,g. pesos de uma rede, superfícies de decisão, estrutura da árvore de decisão, etc).

Retorna:

parâmetros do estimador.

property random_state: int

Seed randômica utilizada pelo estimador.

Retorna:

seed.