Nederlands
The NL entity recognition does not work?
Or am I doing something wrong?
Available pretrained statistical models for Dutch lg, md, sm
https://spacy.io/models/nl
Best result is achieved with a large model. But it has also been trained on wikipedia and will not correctly recognize all Belgian or Dutch names and organizations. Do I have to train my own for better results?
Dutch multi-task CNN trained on UD Alpino and LassySmall. POS tags and dependency parses from Alpino and LassySmall and NER for LassySmall by NLP Town using the OntoNotes 5 scheme. Assigns word vectors, POS tags, dependency parse and named entities. Word vectors trained using FastText CBOW on Wikipedia and OSCAR (Common Crawl).
def get_entities_from_text(text, nlp):
doc = nlp(text)
orgs = []
persons = []
gpes = []
for ent in doc.ents:
print(ent.text, ent.label_)
if ent.label_ == "ORG":
print(ent.text, ent.label_)
orgs.append(ent.text)
if ent.label_ == "PERSON":
print(ent.text, ent.label_)
persons.append(ent.text)
if ent.label_ == "GPE":
print(ent.text, ent.label_)
gpes.append(ent.text)
return orgs, persons, gpes
nlp = spacy.load("nl_core_news_sm")
get_entities_from_text(text, nlp)
text = """
Orderpicker Nachtploeg (M/V) (Regio Vilvoorde - Zaventem)
Voor Adecco, regio Asse, zijn we op zoek naar een orderpicker voor de vaste nachtploeg.
In deze functie ben je samen met je collega's verantwoordelijk voor het klaarzetten van bestellingen. Daarbuiten ga je soms eens de klaargemaakte bestellingen controleren, de beantwoording en een bestelling inputten in het computersysteem.
Gezocht profiel
Je bent bereid om te werken van u tot u.
Je kan zelfstandig werken maar je bent ook een teamplayer.
Je bent gemotiveerd om te werken, je bent loyaal naar een werkgever en je bent opzoek naar stabiliteit.
Je hebt er geen probleem mee om een gewicht van kg te heffen en te verplaatsen.
Je kan beschikken over een eigen transportmiddel omwille van het uurrooster.
Je kan je perfect uitdrukken in beide landstalen om de communicatie met collega's vlot te laten verlopen.
Vereiste studies
» Geen specifieke studievereisten
Talenkennis FRANS (zeer goed), NEDERLANDS (zeer goed)
Werkervaring geen ervaring
Aanbod en voordelen
Interimcontract.
Tijdregeling Voltijds
Dienstregeling Nachtwerk
Een tijdelijk contract tot eind (eventueel verlenging mogelijk).
Een job binnen een aangename werksfeer en een stabiel bedrijf.
Een competitief loon.
Plaats tewerkstelling
Regio Vilvoorde - Zaventem
Solliciteren
Statiestraat
TERNAT
t.a.v Dhr. Gregory Pincket -
Telefonisch contact opnemen met Dhr. Gregory Pincket
t.a.v Dhr. Gregory Pincket
Mogelijk te solliciteren via onze website
Vermeld de
"""
English
English result for a short text is much better but a long job description with a lot of terminology doesn't work very well either.
text_en = u"""
Quantity Surveyor
Posted by Keyman Personnel 10/12/2020
Location:
SW1V, Pimlico, Greater London
Apply Now
Keyman Personnel is looking to expand their Commercial Team in Victoria by appointing an experienced Senior Quantity Surveyor with Building Envelope and Facades background.
Duties
Working on building envelope projects
Preparing tender and contract documents
Bills of quantities with the architect and/or the client
Assisting in establishing a client’s requirements
Cost control
Monthly applications for payments
Subcontractor Management
The ideal candidate will have 3 to 5 years’ experience working with either a Sub or Main Contractor with exposure to façade markets. This is a fantastic opportunity to work for a well-established company that will provide great career progression. You will also be in charge of allocating work to subcontractors.
To apply for this Quantity Surveyor role in Victoria. Please contact Cameron on (phone number removed).
"""
nlp = spacy.load("nl_core_news_lg")
utils.get_entities_from_text(text, nlp)
This one looks much better with a large model NER. Last name is not recognized. Regio Vilvoorde is a GPE location.
Comments
Post a Comment