Crawling big data in a new frontier for socioeconomic research : testing with social tagging
Loading...
Publication date
Advisors
Department
Center
Abstract
Tags and keywords, freely chosen by users for annotating resources, offer a new way
for organizing and retrieving web resources that closely reflect the users’ interests and
preferences, as well as automatically generate folksonomies. Social tagging systems have
gained increasing popularity as a method for annotating and categorizing a wide range
of different web resources. They also attract researchers in social sciences because they
offer a huge quantity of user-generated annotations that reveal the interests of millions of
people. To date, the study using digital trace data methods continues to lack a theoretical
framework, particularly in social science research. This paper presents a methodology to use
big data from Web 2.0 in social research. At the same time, it applies a method to extract
data from a particular social bookmarking site (Delicious) and shows the sort of results that
this type of analysis can offer to social scientists. The illustration is made around the topic
of globalization of agriculture. Using data crawled from a large social tagging system can
have an important impact in the discovering of latent patterns, which is needed to provide
effective recommendations to different actors. In this paper, a sample of 851 users, 526 URLs
and 1,700 tags from the Delicious classification system on the subject of globalization were
retrieved and analyzed. Through the analysis, main users and websites around globalization
issues in Delicious emerged, along with discovering the most important tags that were applied
by users to describe the globalization of agriculture. The implications of these methodology
and findings for further research are discussed.
As etiquetas e palavras-chave escolhidas livremente pelos utilizadores ao anotarem os seus recursos, oferecem uma nova forma de organizar e recuperar recursos na “web” que refletem, de forma mais ajustada, os interesses e preferências dos utilizadores, criando automaticamente e ao mesmo tempo “folksonomies”. Os sistemas sociais de “tagging” são cada vez mais populares enquanto métodos de anotação e categorização de recursos na “web”. Estes métodos também atraem a atenção dos investigadores das ciências sociais por causa da imensa quantidade de anotações geradas pelos utilizadores, as quais revelam os interesses de milhões de pessoas. Até o presente, o estudo dos métodos de análises de dados a partir de registos digitais carece de um enquadramento teórico, particularmente nas ciências sociais. Este artigo apresenta uma metodologia para usar “big data” gerada na “Web 2.0” em estudos de investigação nas ciências sociais. Simultaneamente, o artigo apresenta resultados da aplicação desta metodologia na extração de dados gerados pela aplicação de “bookmarking” no website da Delicious e mostra o tipo de resultados que este tipo de análise pode oferecer aos cientistas sociais. A ilustração da metodologia centra-se no tópico da Globalização da Agricultura. Utilizando dados extraídos a partir duma aplicação de “tagging” de ampla difusão é possível descobrir padrões latentes, de grande importância para a elaboração de recomendações eficazes a diferentes atores. Este artigo reflete a recolha e análise de uma amostra de 851 utilizadores, 526 URLs e 1,700 etiquetas do software Delicious classificadas no tópico “Globalização da Agricultura”. Através desta análise emergiram atores e websites importantes no tópico selecionado, bem como as etiquetas mais relevantes utilizadas na descrição da “Globalização da Agricultura”. Por fim, discutem-se os resultados e implicações da metodologia descrita e as linhas de trabalho futuro.
As etiquetas e palavras-chave escolhidas livremente pelos utilizadores ao anotarem os seus recursos, oferecem uma nova forma de organizar e recuperar recursos na “web” que refletem, de forma mais ajustada, os interesses e preferências dos utilizadores, criando automaticamente e ao mesmo tempo “folksonomies”. Os sistemas sociais de “tagging” são cada vez mais populares enquanto métodos de anotação e categorização de recursos na “web”. Estes métodos também atraem a atenção dos investigadores das ciências sociais por causa da imensa quantidade de anotações geradas pelos utilizadores, as quais revelam os interesses de milhões de pessoas. Até o presente, o estudo dos métodos de análises de dados a partir de registos digitais carece de um enquadramento teórico, particularmente nas ciências sociais. Este artigo apresenta uma metodologia para usar “big data” gerada na “Web 2.0” em estudos de investigação nas ciências sociais. Simultaneamente, o artigo apresenta resultados da aplicação desta metodologia na extração de dados gerados pela aplicação de “bookmarking” no website da Delicious e mostra o tipo de resultados que este tipo de análise pode oferecer aos cientistas sociais. A ilustração da metodologia centra-se no tópico da Globalização da Agricultura. Utilizando dados extraídos a partir duma aplicação de “tagging” de ampla difusão é possível descobrir padrões latentes, de grande importância para a elaboração de recomendações eficazes a diferentes atores. Este artigo reflete a recolha e análise de uma amostra de 851 utilizadores, 526 URLs e 1,700 etiquetas do software Delicious classificadas no tópico “Globalização da Agricultura”. Através desta análise emergiram atores e websites importantes no tópico selecionado, bem como as etiquetas mais relevantes utilizadas na descrição da “Globalização da Agricultura”. Por fim, discutem-se os resultados e implicações da metodologia descrita e as linhas de trabalho futuro.
Unesco Subjects
Bibliographic citation
Borrero Sánchez, J.D., Gualda Caballero, E.: "Crawling big data in a new frontier for socioeconomic research : testing with social tagging". Journal of Spatial and Organizational Dynamics: Discussion Papers Nº12














