Bienvenue à l'Institut de recherche et d'éducation numériques Stata Learning Module Introduction aux graphiques dans Stata Ce module présentera quelques graphiques de base dans Stata 12, y compris des histogrammes, des boxplots, des diagrammes de dispersion et des matrices de diagramme de dispersion. Permet d'utiliser le fichier de données auto pour faire quelques graphiques. La commande histogramme peut être utilisée pour faire un histogramme simple de mpg Si vous créez un histogramme pour une variable catégorielle comme rep78. Vous pouvez ajouter l'option discrete. Comme vous pouvez le voir ci-dessous, lorsque vous spécifiez cette option, le point milieu de chaque case étiquette la barre respective. La commande de boîte de graphique peut être employée pour produire un boxplot qui peut vous aider à examiner la distribution de mpg. Si le mpg était normalement distribué, la ligne (la médiane) serait au milieu de la boîte (les 25e et 75e centiles, Q1 et Q3) et les extrémités des moustaches (les valeurs adjacentes supérieure et inférieure, qui sont les plus extrêmes Les valeurs dans Q31.5 (Q3-Q1) et Q1-1.5 (Q3-Q1), respectivement) seraient équidistantes de la boîte. Le boxplot pour mpg montre oblique positif. La médiane est tirée vers le bas de la boîte. Le boxplot peut être fait séparément pour les voitures étrangères et domestiques en utilisant l'option by () ou over (). Comme vous pouvez le voir dans le graphique ci-dessus, il ya une paire de valeurs aberrantes dans les parcelles boîte produite. Ceux-ci peuvent être supprimés du tracé de boîte en utilisant la commande noout dans Stata. Le graphique ne comprend plus les valeurs éloignées. Stata inclut également un message en bas du graphique indiquant que les valeurs externes ont été exclues. Stata peut également produire des graphiques circulaires. La commande graph pie avec l'option over crée un diagramme circulaire représentant la fréquence de chaque groupe ou la valeur de rep78. L'option plabel place les étiquettes de valeur de rep78 dans chaque tranche du graphique circulaire. Un diagramme de dispersion bidirectionnelle peut être utilisé pour montrer la relation entre le mpg et le poids. Comme on pourrait s'y attendre, il existe une relation négative entre le mpg et le poids. Notez que vous pouvez enregistrer la frappe comme ceci Nous pouvons montrer la ligne de régression de la prévision mpg de poids comme ceci. Nous pouvons combiner ces graphiques comme montré ci-dessous. Nous pouvons ajouter des étiquettes aux points en les étiquetant par make comme indiqué ci-dessous. Notez que mlabel est une option de la commande scatter. La position de l'étiquette peut être modifiée à l'aide de l'option mlabangle (). Nous pouvons combiner des graphiques séparés pour les voitures étrangères et domestiques comme indiqué ci-dessous, et nous avons demandé des bandes de confiance autour des valeurs prédites en utilisant lfitci au lieu de lfit. Notez que l'option par est à la fin de la commande. Vous pouvez demander une matrice de diagramme de dispersion avec la commande de matrice graphique. Ici, nous examinons les relations entre mpg. Poids et prix. Le contenu de ce site Web ne doit pas être interprété comme un endossement d'un site Web particulier, d'un livre ou d'un produit logiciel par l'Université de Californie. Comment lire et utiliser un canevas et des moustaches Un graphique exploratoire, créé par John W. Tukey. Utilisé pour montrer la distribution d'un jeu de données (d'un coup d'œil). Pensez au type de données que vous pourriez utiliser un histogramme avec, et le box-and-whisker (ou box plot, pour le court) pourrait probablement être utile. Le tracé de boîte, bien que très utile, semble se perdre dans des domaines en dehors de Statistiques, mais je ne sais pas pourquoi. Il pourrait être que les gens ne savent pas ou peut-être sont clueless sur la façon de l'interpréter. En tout cas, voici comment vous lisez un complot. Lecture d'un lot de boîtes et de moustaches Let8217s dire que nous demandons 2.852 personnes (et ils miraculeusement tous répondre) combien de hamburgers they8217ve consommé au cours de la semaine dernière. Nous classerons ces réponses du moins au plus grand, puis les représenterons graphiquement avec notre box-and-whisker. Prenez le top 50 du groupe (1 426) qui ont mangé plus de hamburgers qu'ils sont représentés par tout au-dessus de la médiane (la ligne blanche). Ceux dans le haut 25 de hamburger manger (713) sont montrés par le haut 8220whisker8221 et les points. Les points représentent ceux qui ont mangé beaucoup plus que la normale ou beaucoup moins que la normale (outliers). Si plus d'une valeur aberrante consomme le même nombre de hamburgers, les points sont placés côte à côte. Trouver des Skews dans les données Le box-and-whisker bien sûr vous montre plus que quatre groupes divisés. Vous pouvez également voir dans quelle direction les données balancent. Par exemple, s'il ya plus de gens qui mangent beaucoup de hamburgers que de manger quelques-uns, la médiane va être plus élevé ou le whisker haut pourrait être plus long que le bas. Fondamentalement, il vous donne un bon aperçu de la distribution data8217s. That8217s tout ce qu'il ya à lui, donc la prochaine fois you8217re penser à faire un graphique à barres ou un histogramme, pensez à utiliser Tukey8217s bien-aimé box-and-whisker plot aussi. Vous voulez en savoir plus sur la création de graphiques de données Devenez membre.
No comments:
Post a Comment