Hi –
I have an **Article** class, which contains many french legal articles.
…
Here is the class initiation :
```
class_obj = {
"class": "Article",
"description": "Articles des différentes codes de la loi.",
"invertedIndexConfig": {
"stopwords": {
"preset": "none",
#"additions": stopwords_fr
}
},
"vectorizer": "text2vec-transformers",
"properties": [
{
"name": "article_id",
"description": "Id unique de l'article.",
"dataType": [
"text"
],
"indexFilterable": True,
"indexSearchable": False,
},
{
"name": "source",
"description": "Titre de la source juridique (code, loi ou ordonnance) contenant l'article.",
"dataType": [
"text"
],
"tokenization": "lowercase",
"indexFilterable": True,
"indexSearchable": True,
},
{
"name": "titre",
"description": "Le titre de l'article.",
"dataType": [
"text"
],
"indexFilterable": True,
"indexSearchable": True,
"tokenization": "lowercase"
},
{
"name": "texte",
"description": "Le texte de l'article, en html.",
"dataType": [
"text"
],
"moduleConfig": {
"text2vec-transformers": {
"skip": False,
"vectorizePropertyName": False
}
},
"indexFilterable": True,
"indexSearchable": True,
},
{
"name": "etat",
"description": "Etat de l'article : en vigueur, abrogé...",
"dataType": [
"text"
],
"indexFilterable": True,
"indexSearchable": False,
},
{
"name": "path_title",
"description": "Chemin daccès à l'article",
"dataType": [
"text[]"
],
"indexFilterable": True,
"indexSearchable": True,
},
{
"name": "ref_textes",
"description": "Références avec d'autres textes.",
"dataType": [
"text"
],
"indexFilterable": True,
"indexSearchable": False,
},
{
"name": "order",
"description": "Ordre de l'article dans le code.",
"dataType": [
"int"
],
"indexFilterable": True,
"indexSearchable": False,
},
{
"name": "date_deb",
"description": "Date de début de l'article.",
"dataType": [
"int"
],
"indexFilterable": True,
"indexSearchable": False,
},
{
"name": "date_fin",
"description": "Date de fin de l'article.",
"dataType": [
"int"
],
"indexFilterable": True,
"indexSearchable": False,
},
]
}
client.schema.create_class(class_obj)
```
I want to let my users search for legal articles through their "titre" and "source" properties, which have been tokenized using `lowercase`.
Here is an example of an article I'm trying to find :
```
{
"article_id": "JORFARTI000047663197",
"etat": "VIGUEUR",
"path_title": [
"Titre IER : DE LA NATURE DE L'ACTIVITÉ D'INFLUENCE COMMERCIALE PAR VOIE ÉLECTRONIQUE ET DES OBLIGATIONS AFFÉRENTES À SON EXERCICE",
"Chapitre III : Dispositions générales relatives à l'activité d'agent d'influenceur, aux contrats d'influence commerciale par voie électronique, à la responsabilité civile solidaire et à l'assurance civile professionnelle"
],
"source": "LOI n° 2023-451 du 9 juin 2023 visant à encadrer l'influence commerciale et à lutter contre les dérives des influenceurs sur les réseaux sociaux (1)",
"texte": ".....blablabla....",
"titre": "7"
},
```
Using the following query :
```
query {
Get {
Article(
limit: 5,
bm25: {
query: "LOI 9 juin 2023 visant à encadrer l'influence"
properties: ["source^3", "titre"]
}
) {
article_id
titre
path_title
texte
source
_additional {
score
}
}
}
}
```
...gives me the following results :
```
# only printing the "titre" and "source" in a list
[['2023', 'Code civil'], ["Annexe 9 à l'article A4241-50-2", 'Code des transports'], ["Annexe à l'article R*351-1, art. 9", 'Code des ports maritimes'], ['437 à 614-26', 'Code de commerce (ancien)'], ['L79 à L85', 'Code électoral']]
```
Am i missing something ?
It seems like it should be able to find it because i'm literally copy/pasting the exact source name.
Could it be an issue with the lowercase tokenizer ?
I'd be happy to provide you with further information if needed.
Thanks in advance.