Sobre

Column

Sobre min

Nome: Lucas da Silva Guilherme

e-mail:

Instituição: Instituto Federal de Rondônia - IFRO

Column

Sobre o DataSet

Uso de dispositivos móveis e conjunto de dados de comportamento do usuário

Análise de padrões de uso móvel e classificação de comportamento do usuário em dispositivos

Este conjunto de dados fornece uma análise abrangente dos padrões de uso do dispositivo móvel e da classificação do comportamento do usuário. Ele contém 700 amostras de dados do usuário, incluindo métricas como tempo de uso do aplicativo, tempo de tela, fuga de bateria e consumo de dados. Cada entrada é categorizada em uma das cinco classes de comportamento do usuário, variando de pouco a uso extremo, permitindo análise e modelagem perspicazes.

Principais características:

  • ID do usuário: identificador exclusivo para cada usuário.
  • Modelo do dispositivo: modelo do smartphone do usuário.
  • Sistema operacional: O sistema operacional do dispositivo (iOS ou Android).
  • Tempo de uso do aplicativo: tempo diário gasto em aplicativos móveis, medido em minutos.
  • Tela no tempo: Média de horas por dia a tela está ativa.
  • Drenagem de bateria: consumo diário da bateria em mAh.
  • Número de aplicativos instalados: Total de aplicativos disponíveis no dispositivo.
  • Uso de dados: consumo diário de dados móveis em megabytes.
  • Idade: A idade do usuário.
  • Gênero: Gênero do usuário (Masculino ou Feminino).
  • Classe de comportamento do usuário: Classificação do comportamento do usuário com base em padrões de uso (1 a 5).

Este conjunto de dados é ideal para pesquisadores, cientistas de dados e analistas interessados em entender o comportamento do usuário móvel e desenvolver modelos preditivos no campo da tecnologia móvel e aplicativos. Este conjunto de dados foi projetado principalmente para implementar algoritmos de aprendizado de máquina e não é uma fonte confiável para um artigo ou artigo.

Disponível em https://www.kaggle.com/datasets/valakhorasani/mobile-device-usage-and-user-behavior-dataset

Variáveis Qualitativas

Row

Qualitativa Nominal

Sobre este gráfico

Este gráfico de pizza demonstra que a maioria dos celulares desta amostragem utiliza o sistema operacional Android.

Row

Qualitativa Ordinal

Sobre este gráfico

As classes de comportamento variam de uso leve (1) à uso extremo (5). Este gráfico demonstra similaridade nas frequências de diferentes classes de comportamento dos usuários.

Variáveis Quantitativas

Row

Quantitativa Discreta

Sobre este gráfico

  1. Distribuição das idades: A distribuição parece ser relativamente equilibrada, sem um padrão claramente normal ou enviesado.
  2. Picos de frequência: Algumas idades têm um número significativamente maior de usuários, como 22, 27, 33 e 50 anos, sugerindo que essas faixas etárias são mais comuns entre os usuários.
  3. Menos usuários em algumas faixas: Algumas idades apresentam menos usuários em comparação com outras, como em torno dos 37, 46 e 59 anos.
  4. Faixa etária predominante: A maioria dos usuários parece estar entre 18 e 59 anos, indicando que o público-alvo da plataforma pode ser composto por adultos jovens e de meia-idade.
  5. Padrão potencial: Os picos e vales podem indicar padrões sociais, como maior número de usuários em idades associadas ao início da vida profissional (22-25 anos) ou idade média de maior atividade digital.

Row

Quantitativa Contínua

Sobre este gráfico

A maior densidade ocorre entre 2 e 4 horas de tempo de tela, sugerindo que essa faixa de tempo é a mais comum entre os usuários. Após esse pico, há uma leve queda, mas a distribuição continua relativamente alta até 8 horas de tempo de tela. Após 8 horas, a densidade diminui significativamente, indicando que menos usuários passam longos períodos na tela. Existe um pequeno aumento entre 10 e 12 horas, sugerindo que há um segundo grupo menor de usuários que usam dispositivos por períodos muito extensos.

Medidas de Tendência Central

Row

Média

Sobre este gráfico

Assimetria Positiva (direcionada à direita) A moda (valor mais frequente) está bem à esquerda, indicando que muitos usuários passam pouco tempo no aplicativo. A mediana está mais à direita que a moda, sugerindo que metade dos usuários passa mais tempo que esse valor. A média está ainda mais à direita, o que indica a presença de outliers (usuários que usam o app por muito tempo), arrastando a média para cima.

Distribuição bimodal O gráfico sugere dois picos principais (bimodalidade), indicando que há dois grupos distintos de usuários: Um grupo com uso mais curto (pico na esquerda) Outro grupo com uso mais longo (pico à direita, embora menos pronunciado) Isso pode representar, por exemplo, usuários casuais e usuários intensivos do aplicativo.

Medidas Separatrizes e Box-plots

Row

Quartis, Decis, Percentis

Sobre este gráfico

Row

Box-Plot

Sobre este gráfico

Tempo Médio de Tela: A maioria dos usuários parece passar entre 4 e 8 horas por dia na tela. Variação: Há uma variação moderada no tempo de tela, com alguns usuários passando significativamente mais ou menos tempo na tela (possíveis outliers). Assimetria: Se a mediana não estiver no centro da caixa, isso pode indicar uma distribuição assimétrica dos dados.

Medidas de dispersão

Row

Desvio Médio absoluto

[1] "Desvio Médio Absoluto da quantidade de Apps instalado:  23.4836285714286"

Sobre este gráfico

Um DMA de 23.48 indica que, em média, o número de aplicativos instalados pelos usuários desvia-se 23.48 apps da média. Isso sugere uma variabilidade considerável no número de apps instalados.

Row

Variância

[1] "Variância do número de apps instalados é:  725.942716125077"

Sobre este gráfico

Um valor de 725.94 indica que há uma grande dispersão no número de aplicativos instalados. Quanto maior a variância, mais espalhados estão os dados.

Row

Desvio Padrão

[1] "Desvio Padrão do número de apps instalados é:  26.9433241476451"

Sobre este gráfico

A variância mede a dispersão dos dados em relação à média, elevando os desvios ao quadrado. Um valor de 725.94 indica que há uma grande dispersão no número de aplicativos instalados. Quanto maior a variância, mais espalhados estão os dados.