Memberikan Opsi Stopword Custom dan Menambahkan min_length#14
Conversation
…urang dari min_length akan di hapus juga
# reformat code sehingga lebih rapi
har07
left a comment
There was a problem hiding this comment.
Perlu dipertimbangkan kembali penambahan type hints karena akan menyebabkan pysastrawi tidak lagi support python 2
| """description of class""" | ||
|
|
||
| def create_stop_word_remover(self, words = None): | ||
| def create_stop_word_remover(self, words: list = None): |
There was a problem hiding this comment.
Keliatannya fitur type hints tidak dikenali di python 2.7 sehingga menyebabkan build error: https://travis-ci.org/har07/PySastrawi/builds/430521968?utm_source=github_status&utm_medium=notification
| return self.dictionary | ||
|
|
||
| def remove(self, text): | ||
| def remove(self, text, min_length: int = 1): |
There was a problem hiding this comment.
Keliatannya fitur type hints tidak dikenali di python 2.7 sehingga menyebabkan build error: https://travis-ci.org/har07/PySastrawi/builds/430521968?utm_source=github_status&utm_medium=notification
There was a problem hiding this comment.
Bagaimana kalau dihapus saja bagian type hints nya (: int )? Sayang sekali kalau harus drop support untuk python 2.7 karena version 2.7 masih banyak beredar (default di ubuntu < 18.04 dll), termasuk di laptop saya 😸
There was a problem hiding this comment.
yup gk masalah sih mas, berarti yg gk bisa di python 2.7 cuma :int nya kan?
|
|
||
| def create_stop_word_remover(self): | ||
| stopWords = self.get_stop_words() | ||
| def create_stop_word_remover(self, words: list = None): |
har07
left a comment
There was a problem hiding this comment.
Mohon dihilangkan dahulu penggunaan type hints nya. Terima kasih
|
Penambahan contoh cara penggunaan 2 parameter baru di atas ke dalam README juga akan sangat membantu |
|
Selamat malam, mau tanya bagaimana jika mau mengurangi kata yang termasuk kedalam stopwordnya? Terimakasih. |
Menurut saya stopword custom sangat memungkinkan dalam pemrosesan text, jadi diperlukan untuk penambahan opsi jika user yang menggunakan library ini dapat menggunakan file stopword sendiri
Kemudian, menurut saya opsi min_length juga bisa ditambahkan pada stopword, sehingga jika user memberikan min_length maka string dengan jumlah character kurang akan dihapus juga
*kedua usul ini merupakan opsi yang hanya akan terjadi jika user menambahkan parameter, jadi secara default tetap seperti sebelumnya