Análise de sentimento - dicas do Excel

Análise de sentimento no Excel! Há um add-in gratuito do Microsoft Labs que permitirá que você faça análises de sentimento no Excel. E se você tiver que examinar centenas de comentários da pesquisa para ver o que as pessoas pensam da sua empresa? O Excel pode atribuir uma probabilidade mostrando o quão positivo ou negativo é cada comentário.

Assistir vídeo

  • É fácil quantificar os dados da pesquisa quando se trata de múltipla escolha
  • Você pode usar uma tabela dinâmica para descobrir a porcentagem de cada resposta
  • Mas e as respostas de texto em formato livre? Eles são difíceis de processar se você tiver centenas ou milhares deles.
  • A análise de sentimento é um método baseado em máquina para prever se uma resposta é positiva ou negativa.
  • A Microsoft oferece uma ferramenta que faz Análise de Sentimentos no Excel - Azure Machine Learning.
  • A análise de sentimento tradicional requer que um ser humano analise e categorize 5% das declarações.
  • A análise de sentimento tradicional não é flexível - você reconstruirá o dicionário para cada setor.
  • O Excel usa MPQA Subjetividade Lexicon (leia sobre isso em http: // bit. Ly / 1SRNevt)
  • Este dicionário genérico inclui 5.097 palavras negativas e 2.533 palavras positivas
  • Cada palavra é atribuída a uma polaridade forte ou fraca
  • Isso funciona muito bem para frases curtas, como tweets ou postagens no Facebook
  • Ele pode ser enganado por negativos duplos
  • Para instalar, vá para Inserir, Loja do Excel, pesquise por Azure Machine Learning
  • Especifique um intervalo de entrada e duas colunas em branco para o intervalo de saída.
  • O título para o intervalo de entrada deve corresponder ao esquema: tweet_text
  • Artigo complementar em: http://sfmagazine.com/post-entry/may-2016-excel-sentiment-analysis/

Transcrição de vídeo

Aprenda Excel com o Podcast, Episódio 2062: Análise de sentimento no Excel

Ah, ei, era uma noite de Ação de Graças e estávamos sentados em volta da torta de abóbora e Jes, amigo nosso, começou a falar sobre fazer análise de sentimento nos dados do Twitter. E eu disse: “Ei, você sabe que o Excel tem uma maneira de fazer análise de sentimento”. E percebi que não tinha um bom vídeo sobre este ou qualquer vídeo sobre isso, então este vídeo é sobre como fazer análise de sentimento no Excel.

Agora, a primeira pergunta é: o que diabos é análise de sentimento? E se você fizer uma pesquisa com seus clientes e eles tiverem uma seleção de múltipla escolha, onde podem escolher de 1 a 5, bem, isso é muito, muito fácil de analisar. Você pode apenas criar uma pequena tabela dinâmica: Insira a tabela dinâmica, Planilha Existente aqui, clique em OK. Queremos saber a pergunta ali ou a resposta à pergunta e, em seguida, quantas respostas havia para cada uma, e isso nos dá o número absoluto. Você pode até entrar aqui e alterar isso em Configurações de campo para Mostrar valores como uma% do total da coluna, assim.

Tudo bem, então você pode ver para cada resposta qual porcentagem das pessoas obtém uma resposta. Tudo bem, mas a análise de sentimento é para quando você tem uma resposta muito longa onde diz: "Ei, tudo bem, você sabe, diga-nos por que você nos deu essa resposta?" E eles, você sabe, usam frases ou parágrafos. Bem, se você tem centenas ou milhares deles, é muito difícil para alguém ler tudo e descobrir o que está acontecendo, certo?

Portanto, há dois tipos diferentes de análise de sentimento. Normalmente, você usaria um algoritmo de aprendizado supervisionado humano. Então, se você teve 5.000 respostas, vá até, você sabe, 200 delas e escolha as palavras e frases positivas e negativas. Você está essencialmente construindo um dicionário de palavras positivas e negativas; mas, você sabe, isso era muito limitante. Se você fez isso para um lugar que fazia conserto de automóveis e depois tinha um cliente diferente, sabe, que fazia a limpeza de carpetes, esses dois dicionários são completamente diferentes. Você tem que fazer o aprendizado de máquina ou o aprendizado supervisionado por humanos continuamente. Então, o Excel usa essa coisa chamada Léxico de Subjetividade MPQA e você pode ir para o Google. Ele tem as informações sobre ele - 5.097 palavras negativas, 2533 palavras positivas. E entao,ele funciona muito bem para frases curtas ou tweets ou postagens no Facebook. Mas uma coisa que percebi é que, se alguém está escrevendo em negativos duplos, não posso dizer que não odeio esse recurso, bem, o aprendizado de máquina vai falhar aí. E diabos, eu falhei. Não sei dizer se estão felizes ou não.

Tudo bem, então aqui está o que fazemos. No Excel 2013 ou Excel 2016, vá para a guia Inserir, vá para a Loja, quando a caixa de pesquisa aparecer, pesquise a Máquina do Azure e você obterá o Azure Machine Learning ali mesmo. Clicamos em Adicionar. Tudo bem, e duas ferramentas diferentes aqui: o Titanic Survivor Predictor, que é divertido; e o suplemento do Excel de análise de sentimento de texto. Vamos usar esse. Tudo bem, aqui estão algumas coisas que vão enganá-lo. Seu título: pegue um parágrafo para explicar sua resposta. Ele precisa corresponder ao Esquema e o Esquema diz que o título deve ser tweet_text. Então, aqui em cima: tweet_text, é claro, questões sensíveis a maiúsculas e minúsculas, certo. Em seguida, feche o Esquema e, em seguida, Prever, Entrada: A1 a 100, Meus dados têm cabeçalhos, Saída: DadosB1, Incluir os cabeçalhos. Eles vão nos dar 2 colunas.Certifique-se de que você tenha 2 colunas em branco; caso contrário, ele substituirá os dados. Você tem 2 opções: algumas linhas por vez ou como um lote. Isso é apenas cem, então realmente não importa. Vou escolher Predict e BAM! Tão rápido.

Tudo bem agora, temos 2 colunas: temos um Sentimento e uma Pontuação, tudo bem. Então, vamos representar as pontuações aqui como porcentagens com um monte de casas decimais. Tudo bem, então 47.496, isso vai de 0 a 100%. Perto de 100 é extremamente positivo, perto de 0 é extremamente negativo, certo? Então, aqui, temos um em que há um pequeno problema que me deixa louco. Não é possível encontrar a solução, então você pode ver por que isso está sendo classificado como extremamente negativo. Vejamos um que é extremamente positivo. Tudo bem, então você sabe, então temos algumas palavras felizes aqui: por favor e obrigado, pontos de exclamação e assim por diante. Isso pode estar contribuindo para a pontuação mais alta. Tudo bem, então é perfeito? Não, mas vai lhe dar uma maneira rápida e rápida de dizer, você sabe, quantas pessoas estão extremamente felizes ou extremamente negativas com essas respostas.

E, claro, novamente, aqui podemos fazer isso com uma tabela dinâmica: Inserir, Tabela Dinâmica, vá para uma Planilha Existente aqui, clique em OK, e estamos interessados ​​no Sentimento, e então talvez com a Pontuação média seja para cada um deles. Portanto, vamos alterar isso em Configurações de campo para uma média, clique em OK. E assim, ou talvez até um conde. Acho que gostaríamos de saber o conde, quantas pessoas. Então, vamos pegar outro campo, e assim, sabemos quantas pessoas foram negativas. Ooh, quantas pessoas foram neutras, quantas pessoas foram positivas e qual foi a pontuação média de cada uma delas.

Tudo bem, então se você tiver dados de pesquisa e for uma escolha múltipla, é fácil usar uma tabela dinâmica para descobrir a porcentagem de cada resposta. Mas para respostas de texto de formato livre, é difícil de processar. Se você tiver centenas ou milhares deles, a análise de sentimento é um método baseado em máquina para prever se uma resposta é positiva ou negativa. A Microsoft oferece uma ferramenta gratuita para isso. Funciona no Excel 2013 ou Excel 2016, chamado Azure Machine Learning. Normalmente, é necessário analisar e categorizar 5% das declarações manualmente. Não é flexível, você tem que recategorizar para cada novo conjunto de dados, mas o Excel está usando este Léxico de Subjetividade MPQA. É um dicionário genérico. Vai funcionar para frases curtas, tweets, publicações no Facebook. Posso ser enganado por negativos duplos. Então vá para a Loja do Excel,pesquise o Azure Machine Learning. Especifique uma entrada e duas colunas para um intervalo de saída. Não se esqueça de alterar o título para corresponder ao Esquema, tweet_text, neste caso específico.

Tudo bem, então aí está. Na próxima vez que você tiver uma grande quantidade de dados para analisar, verifique usando o Azure Machine Learning, o suplemento gratuito para Excel 2013. Obrigado por passar por aqui, nos vemos na próxima vez para outro netcast de.

⇬ Fazer download do arquivo

Baixe o arquivo de amostra aqui: Podcast2062.xlsm

Artigos interessantes...