Skip to content

Update article #1

Description

@nlpneurobot

Bonjour,

Je viens de passer en revue votre article et j'ai croisé quatre choses :

  • Dans la partie 2, pour les stopwords, il faut au préalable installer la librairie nltk et de télécharger la collection "stopwords". L'erreur renvoie sur cet article https://www.nltk.org/data.html et informe des commandes à utiliser :
import nltk
nltk.download()
  • Dans la partie 6, pour visualiser les relations, il ne faut pas réutiliser la méthode servequi est déjà en route mais la méthode render. La ligne devient :
displacy.render(doc, style="dep")
  • Dans la partie 8, Vous avez défini la fonction return_mean_embedding mais vous tentez d'appeler la méthode return_tensor. Le calcul de distance ne peut donc pas se faire. J'ai modifié ainsi :
print(np.linalg.norm(return_mean_embedding(test)-return_mean_embedding(test_2)))
print(np.linalg.norm(return_mean_embedding(test)-return_mean_embedding(test_3)))
print(np.linalg.norm(return_mean_embedding(test)-return_mean_embedding(test_4)))
  • Dans la partie 8, Le résultat de calcul de distance rapproche plus la phrase 3 que la phrase 2 bien que la différence ne soit pas aussi importante qu'avec la phrase 4. Les valeurs obtenues sont les suivantes :

12.26192
12.17234
20.493286

Je trouve ça normal et si nous passons la phrase 3 au passé puisque la phrase test informe que c'est normalement fini alors la distance se réduit à 9.988532

My 2 cents du jour

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type
    No fields configured for issues without a type.

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions