aibox.nlp.core.dataset
Interface básica para datasets.
Classes
|
Classe abstrata representa um Dataset para classificação ou regressão. |
- class aibox.nlp.core.dataset.Dataset[código-fonte]
Base:
ABC
Classe abstrata representa um Dataset para classificação ou regressão. Essa classe supõe que os dados passados já foram limpos e/ou processados.
Classes concretas definem construtores bem como métodos adicionais.
- abstract to_frame() DataFrame [código-fonte]
Converte esse dataset para um DataFrame (cópia) com as colunas:
text (str): textos;
target (numérico): label;
O DataFrame pode ter colunas adicionais.
- Retorna:
representação desse dataset como um DataFrame.
- Tipo de retorno:
- abstract cv_splits(k: int, stratified: bool, seed: int) list[DataFrame] [código-fonte]
Retorna splits para serem utilizados. Esse método particiona o dataset em k partes aleatórias de tamanho similar.