Сообщения

Сообщения за май, 2024

СТРУКТУРНЫЙ SENTIMENT АНАЛИЗ ИНФОРМАЦИИ С МОДЕЛЯМИ MDS, ACM И ОЦЕНКОЙ ДИСПЕРСИИ

Изображение
Для данного анализа я выбрала текст о бесплатных нейронных сетях, которые могут генерировать графические изображения по тексту. Из анализа по данной схеме мы видим, что текст негативный, нежели позитивный, но в нём есть также некоторые позитивные ключевые слова. Суть текста заключается больше в технической части, нежели в критике или похвале, поэтому анализировать эмоциональный окрас достаточно затруднительно. Следующий метод оказался для меня не эффективным. Программа смогла поделить текст лишь на две несвязные между собой части, это абзатц про ИИ сбербанка, и всё остальное. Тем не менее программа видит абзатц про сбербанк более негативным, нежели все остальные (они более зелёные). Вот эта схема показалась мне наиболее понятной и подробной. Программа распределила все абзатцы и наглядно показывает какого эмоционального окраса может быть текст. И уже сразу видны отличия от первого метода, потому что здесь больше зелёных абзатцев, чем синих, а первая схема показывала, что текст преимущес...

SENTIMENT-АНАЛИЗ ТЕКСТА

Изображение
Для анализа я выбрала текст о свойствах шоколада разного типа. По какой-то причине программа не смогла считать половину текста. Тем не менее, мы можем увидеть, что в тексте преобладает негативное настроение, затем положительное и негативное. В тексте рассказывается о методе изготовления шоколада разных типов, а также его вреде. Программа поделила текст на три части, голубую (масло, сухое молоко, паста, вкус, тёмный и т.д), синюю (порошка), и жёлтую (подсластитель, ароматизатор, ванилин, состав и т.д). Можно подумать, что программа в самом деле разделила текст на естественные продукты для шоколада, и всякие усилители вкуса. А так как порошок сложно отнести к этим двум группам, он вынесен в отдельный цвет.

SENTIMENT ANALYSIS В СОЦИАЛЬНЫХ МЕДИА

Изображение
 1) Кот Я анализировала также слово "кот" и анализ программы вышел полным в связи с активным упоминанием этого слова в различных социальных сетях. Очень много и позитивного (9%) и негативного (3%) упоминания. Такая разница может быть связана с тем, что большая часть людей любит животных и котов в том числе. А негативные упоминания чаще всего связаны с пропажей домашних животных. По данным статистики, чаще всего котов упоминают в видеороликах на различных платформах. Третий столбец показывает нам то, что чаще всего люди ищут смешные видео с котиками. 2) Собака Данная статистика показывает нам, что аудитория относится дружелюбнее к собакам, чем к котам. Чаще всего с собаками постятся фотографии, нежели видео как с котами. Ключевые слова показывают заинтересованность аудитории в познании пород собак, выставок, а также смешные видео с животными. 3) Попугай Несмотря на активную популярность попугаев в сети, аудитория считает котов и собак наиболее интересными. Также, как и с соба...

КЛАСТЕРНЫЙ АНАЛИЗ ИЗ ВНЕШНЕЙ БАЗЫ ДАННЫХ

Изображение
Данные заголовки объединяет промежуток времени 20.05.2024 - 26.05.2024, а также наличие слова "cat" в статьях, которое я и указала в настройках. Сложно определить сходства в заголовках в связи с тем, что не всегда это слово упоминается. Объединение: Цветом. Поля разных цветов обозначают разные направления СМИ, в которых упоминается выбранное слово. Будь то интервью, журналы, книги и т.д. Объединений между постами в одних секциях я, если честно, никаких не нашла. В целом есть всего две секции, в которых объединены какие-то публикации, и я не могу разобрать что в них общего. Например, в серой зоне приложение объединило новость о нашествии котов на США и статью о том, что детям и старикам нельзя заходить в интернет (какое это вообще имеет отношение к котам, я не знаю)... Линиями. Линиями объединены происшествия, которые уже произошли на данный момент. Об этом говорит сама программа "as it happened". Однако больше никаких сходств я не увидела, кроме того, что это всё св...

АВТОМАТИЗИРОВАННЫЙ КЛАСТЕРНЫЙ АНАЛИЗ

Изображение
В качестве текстов я использовала комментарии под видео " СЛЕДУЙ ЗА ПОЕЗДОМ, СИДЖЕЙ!.. ОЙ... АРТУР... (RED DEAD REDEMPTION 2 #12)", а именно анекдоты про ковбоев от подписчиков. На первой картинке мы видим полное разделение текстов на каждое индивидуально. На второй картинке программа выделяет пятый и третий текста как связанные. Это связано с тем, что у них общая тематика - салун и перестрелка. На третьей картинке программа объединяет второй и шестой, а также третий и пятый. Их объединяет место действия - перия + салун. На четвёртой картинке программа делит все анекдоты на две группы. Первая группа объединена упоминанием коней, а вторая "заходит как-то ковбой в бар...". На самом деле делание анекдотов на группы очень просто объяснить, у них есть общие мотивы, упоминания, герои или даже фразы. Благодаря этому программе было действительно легко поделить их. Количество групп изменяется в меньшее кол-во групп.

АВТОМАТИЗИРОВАННЫЙ КОНТЕНТ-АНАЛИЗ С МОДЕЛЬЮ ТЕКСТА

Изображение
 Для анализа я выбрала тексты песен Егора Крида на тему любви: дым, отпускаю, грустно, была не была, we gotta get love. Анализ: мне сложно сказать, что для меня оба варианта являются понятными и простыми. Я не считаю что оба метода хорошо способны определить тему и мотив содержания. Возможно, если смотреть по отдельности каждую единицу, то будет корректнее, но не всё вместе. Но должна сказать что это достаточно интересно. Мне очень нравится облако частоповторяющихся слов, по нему можно определить, как минимум, слова паразиты исполнителя. В общем представлении понятно, что человек страдает от любви, что не скажешь о второй картинке. По ней мне не понятно ничего :( Ладно, зато первая строчка звучит смешно. Если оценивать из этих двух, то первый метод мне более понятен и интересен.

ФОНОСЕМАНТИЧЕСКИЙ АНАЛИЗ

Изображение
 В качестве анализа я взяла три текста Пушкина о любви: 1) Я помню чудное мгновенье Анализ данного текста дался программе достаточно тяжело. Она не смогла выявить яркой эмоциональной окраски, хотя данное произведение пронизано чувственностью, любовью и гармонией. Программа определила, что текст "плохой", "отталкивающий", "низменный", "злой", с чем, конечно, тяжело согласиться. Но на счёт сложности, вероятно, правда, потому что сама тема чувств достаточно сложная даже для человека, не то что для робота. "Шероховатый" и "угловатый" я не смогу никак прокомментировать, затрудняюсь в идентификации данных параметров. Также программа считает, что текст светлый, нежный, женственный, тяжёлый и сильный, что на мой взгляд является правдой. Действительно, зачастую разговоры о чувствах склонны женщинам, за счёт нашей эмоциональности, а тяжёлым текст может быть для понимания, в виду того что стихи часто сложнее воспринимаются чем прямой те...