Badanie zastosowania rozwiązań semantycznych do integracji danych oraz budowy modeli logicznych języka umożliwiających wnioskowanie
Purus suspendisse a ornare non erat pellentesque arcu mi arcu eget tortor eu praesent curabitur porttitor ultrices sit sit amet purus urna enim eget. Habitant massa lectus tristique dictum lacus in bibendum. Velit ut viverra feugiat dui eu nisl sit massa viverra sed vitae nec sed. Nunc ornare consequat massa sagittis pellentesque tincidunt vel lacus integer risu.
Mauris posuere arcu lectus congue. Sed eget semper mollis felis ante. Congue risus vulputate nunc porttitor dignissim cursus viverra quis. Condimentum nisl ut sed diam lacus sed. Cursus hac massa amet cursus diam. Consequat sodales non nulla ac id bibendum eu justo condimentum. Arcu elementum non suscipit amet vitae. Consectetur penatibus diam enim eget arcu et ut a congue arcu.
Vitae vitae sollicitudin diam sed. Aliquam tellus libero a velit quam ut suscipit. Vitae adipiscing amet faucibus nec in ut. Tortor nulla aliquam commodo sit ultricies a nunc ultrices consectetur. Nibh magna arcu blandit quisque. In lorem sit turpis interdum facilisi.
Vitae vitae sollicitudin diam sed. Aliquam tellus libero a velit quam ut suscipit. Vitae adipiscing amet faucibus nec in ut. Tortor nulla aliquam commodo sit ultricies a nunc ultrices consectetur. Nibh magna arcu blandit quisque. In lorem sit turpis interdum facilisi.
“Nisi consectetur velit bibendum a convallis arcu morbi lectus aecenas ultrices massa vel ut ultricies lectus elit arcu non id mattis libero amet mattis congue ipsum nibh odio in lacinia non”
Nunc ut facilisi volutpat neque est diam id sem erat aliquam elementum dolor tortor commodo et massa dictumst egestas tempor duis eget odio eu egestas nec amet suscipit posuere fames ded tortor ac ut fermentum odio ut amet urna posuere ligula volutpat cursus enim libero libero pretium faucibus nunc arcu mauris sed scelerisque cursus felis arcu sed aenean pharetra vitae suspendisse ac.
Ze względu na różnorodność danych podlegających integracji oraz przetwarzaniu w ramach platformy inteligentnego asystenta istotnym aspektem jest możliwość zastosowania rozwiązań semantycznych do integracji danych. Jednym z problemów są nieustrukturyzowane źródła danych – np. sposób zapisu danych kontaktowych w postaci tekstu.
Dane kontaktowe są istotne z punktu widzenia pracy inteligentnego asystenta i ich możliwość opisania w celu dalszej analizy jest istotnym zagadnieniem wymagającym rozwiązania.
Badanie przeprowadzone na nieustrukturyzowanym zbiorze danych kontaktowych w postaci wizytówek oraz danych kontaktowych pochodzących ze stopek pozwoli zbadać możliwości opisu semantycznego w celu dalszej integracji.
W ramach wytycznych wytypowano opracowanie prototypu mogącego działać w środowisku urządzenia mobilnego – tj. bez dostępu do Internetu, wytypowano użycie bibliotek TensorFlow na potrzeby trenowania oraz inferencji oraz TensorFlow Lite na potrzeby inferencji w środowisku urządzenia mobilnego
Na podstawie przeprowadzonych badań na zbiorach danych w języku polskim w środowisku urządzenia mobilnego zaobserwowano istotne ograniczenia w zakresie możliwości stosowania zaawansowanych technik opartych głębokiego uczenia maszynowego – m.in. sieci rekurencyjnych LSTM. W związku z ograniczeniami zastosowano nietypowe podejście w postaci zastosowania sieci konwolucyjnych. Ze względu na szerokość słownika, różnorodność zapisu, błędy rozpoznania tekstu z obrazu przy wizytówkach oraz inne literówki postanowiono przeprowadzić tokenizację z wykorzystaniem trigramów. Rozwiązanie to sprawdziło się w praktyce w połączeniu z sieciami konwolucyjnymi.
Case studies z naszych realizacji - opisujemy wdrożenia sztucznej inteligencji.