aibox.nlp.estimators.generic.transformers
Estimador baseado na arquitetura Transformer.
Classes
|
Estimador genérico baseado na arquitetura Transformers utilizando o |
- class aibox.nlp.estimators.generic.transformers.TransformerEstimator(kind: Literal['classifier', 'regressor'], model_name: str = 'neuralmind/bert-base-portuguese-cased', max_seq_len: int = 512, epochs: int = 2, batch_size: int = 8, learning_rate: float = 5e-05, random_state: int | None = None, do_lower_case: bool = False, regression_ensure_bounds: bool = False)[código-fonte]
Base:
Estimator
Estimador genérico baseado na arquitetura Transformers utilizando o
huggingface
.- Parâmetros:
kind (Literal['classifier', 'regressor']) – se é uma rede de classificação ou regressão.
model_name (str) – nome do modelo base. Defaults to “neuralmind/bert-base-portuguese-cased”.
max_seq_len (int) – tamanho máximo de uma sentença ( é realizado truncamento).
epochs (int) – quantidade de épocas de treinamento.
batch_size (int) – tamanho do batch utilizado para treino e avaliação.
learning_rate (float) – taxa de aprendizado passada para o otimizador.
random_state (int | None) – seed.
do_lower_case (bool) – se a tokenização deve converter para caixa baixa.
regression_ensure_bounds (bool) – caso rede seja de regressão, se os valores preditos devem ser clipados para o máximo e mínimo encontrados durante treinamento.
- predict(X: list[int] | list[float] | ndarray[int32] | ndarray[float32] | Tensor | list[str] | ndarray[str_], **kwargs) ndarray [código-fonte]
Realiza a predição utilizando os parâmetros atuais do modelo.
- Parâmetros:
- Retorna:
predições com shape (n_samples,).
- Tipo de retorno:
- fit(X: list[int] | list[float] | ndarray[int32] | ndarray[float32] | Tensor | list[str] | ndarray[str_], y: list[int] | list[float] | ndarray[int32] | ndarray[float32] | Tensor, **kwargs)[código-fonte]
Realiza o treinamento do estimador.
- Parâmetros:
X (list[int] | list[float] | ndarray[int32] | ndarray[float32] | Tensor | list[str] | ndarray[str_]) – features no formato (n_samples, n_features).
y (list[int] | list[float] | ndarray[int32] | ndarray[float32] | Tensor) – saída esperada com formato (n_samples,)
**kwargs – parâmetros extras que podem ser passados para alguns estimadores.
- property hyperparameters: dict
Hiper-parâmetros do modelo. Inclui a seed randômica. Estrutura do dicionário varia entre diferentes estimadores.
- Retorna:
dicionário de hiper-parâmetros.