Posted on

Indice de gini exemple

Score de Gini donne une idée de la façon dont une scission est par la façon dont les classes mixtes sont dans les deux groupes créés par la scission. Réponse: Déterminez l`attribut qui classifie le mieux les données d`apprentissage; utiliser cet attribut à la racine de l`arborescence. Un autre défaut est que les distributions de revenus très différentes peuvent entraîner des coefficients de Gini identiques. Chaque échantillon se compose d`un vecteur p-dimensionnel, où les valeurs d`attribut représentent ou les caractéristiques de l`échantillon, ainsi que la classe dans laquelle tombe. François Bourguignon et Christian Morrisson estiment que le chiffre était 0. Nous le calculons pour chaque ligne et fractionner les données en conséquence dans notre arborescence binaire. Coefficient de Gini de 1. Les résultats se comparent favorablement avec les estimations du jackknife avec un accord améliorant avec la taille d`échantillon croissante. Les coefficients de Gini peuvent être utilisés pour comparer la répartition du revenu dans le temps, il est donc possible de voir si l`inégalité augmente ou diminue indépendamment des revenus absolus. La CIA donne le réel Gini pour Haïti en 2012 comme 60. Lorsque cela se produit, il crée simplement un nœud de feuille pour l`arbre de décision en disant de choisir cette classe. Prenons les dossiers 8/10 et essayons de travailler avec une fente de gain d`information.

Le cas proverbiale où les 20% les plus riches ont 80% de tous les revenus (voir le principe Pareto) conduirait à un revenu coefficient de Gini d`au moins 60%. Là encore, le code de cet exemple est disponible sur GitHub ici. Comprenons-nous ces aspects en détail. En Inde, il existe un certain nombre de cuisines différentes disponibles et les gens ont des préférences alimentaires différentes. Le résultat est le gain d`information, ou la diminution de l`entropie. Variable binaire qui signifie qu`il prend deux valeurs (oui et non). Les comtés ou les États ou les pays avec de petites populations et des économies moins diversifiées auront tendance à rapporter de petits coefficients de Gini. L`indice de Gini est souvent représenté graphiquement par la courbe de Lorenz, qui montre la répartition du revenu (ou de la richesse) en traçant le percentile de la population par le revenu sur l`axe horizontal et le revenu cumulatif sur l`axe vertical. Courbe de Lorenz, divisée par la zone en dessous de la ligne de l`égalité parfaite. Une autre limitation du coefficient de Gini est qu`il ne s`agit pas d`une mesure appropriée de l`égalitarisme, car il ne s`agit que de mesures de dispersion des revenus. En fait, l`indice de Gini maximal pour un nombre donné de classes est toujours égal au maximum de l`indice d`erreur de classification car pour un certain nombre de classes n, nous avons défini la probabilité est égale à p = 1/n et l`indice de Gini maximal se produit à 1-n * (1/n) ^ 2 = 1-1/n , tandis que l`indice d`erreur de classification maximale se produit également à 1-max {1/n} = 1-1/n.

ci-dessus, vous pouvez voir que le chi-carré également identifier la répartition entre les sexes est plus significatif comparer à la classe. Lorsque la population est grande, la répartition du revenu peut être représentée par une fonction de densité de probabilité continue f (x) où f (x) DX est la fraction de la population avec la richesse ou le revenu dans l`intervalle DX sur x. En d`autres termes, l`indice Shorrocks compare l`inégalité des revenus à court terme, comme le revenu annuel des ménages, à l`inégalité des revenus à long terme, comme le revenu total de cinq ans ou de 10 ans pour les mêmes ménages.