Types de données statistiques. Analyse des données préliminaires

Les données statistiques peuvent être présentées sous forme de tableaux statistiques, de graphiques statistiques et de tableaux statistiques.

Tableaux statistiques sont élaborés à la suite de la synthèse et du regroupement des données d’observation disponibles. Les tableaux statistiques contiennent nécessairement des indicateurs synthétiques et sont constitués d'un sujet et d'un prédicat.

Objet du tableau montre de quoi parle le tableau, il est situé à gauche et représente le contenu des lignes.

Prédicat de table situé en haut et représente le contenu du graphique. Le prédicat montre quelles caractéristiques caractérisent le sujet.

Graphiques statistiques. La construction de graphiques statistiques est l'étape finale de la synthèse et du regroupement des données statistiques. La représentation graphique est la forme la plus efficace de présentation de données statistiques du point de vue de leur perception.

Calendrier appelé une représentation visuelle conditionnelle de quantités statistiques et de leurs relations à l'aide de lignes et de figures géométriques.

Chaque graphique doit comprendre les éléments suivants : une image graphique, un champ graphique, des lignes directrices à l'échelle et un système de coordonnées.

Image graphique - signes géométriques, un ensemble de points, de lignes, de figures à l'aide desquels des quantités statistiques sont représentées.

Champ graphique représente un espace dans lequel sont placés des signes géométriques.

Les références d'échelle d'un graphique statistique sont déterminées par l'échelle et la barre d'échelle.

Échelle du graphique statistique - il s'agit d'une mesure de conversion d'une valeur numérique en valeur graphique,

Échelle d'échelle - une ligne dont les points spécifiques peuvent être lus comme des nombres spécifiques. L'échelle se compose d'une ligne (le support d'échelle) et d'un certain nombre de points marqués dessus, disposés dans un certain ordre.

Échelle uniforme est la longueur d'un segment pris comme unité et mesuré dans une certaine mesure.

Pour placer des signes géométriques dans le champ graphique, un système de coordonnées est requis. Le système le plus courant est celui des coordonnées rectangulaires.

Selon la méthode de construction, les graphiques sont divisés en graphiques linéaires, diagrammes, cartogrammes et diagrammes cartographiques.

La classe des graphiques linéaires comprend : les polygones, les cumulats et les courbes de Lorenz.

Polygone appelé ligne brisée dont les segments relient les points X et/j (X j - valeur caractéristique ; - fréquence).

Le polygone est utilisé pour une série de distribution discrète.

Cumule- une ligne brisée, constituée à partir de fréquences ou fréquences accumulées, dont les coordonnées des points sont X ( Et F. (X j- valeur de la caractéristique, pour une série d'intervalles - limite supérieure des valeurs (X.);/ ( - fréquence cumulée).

Le point de départ de la ligne brisée de la série de distributions d'intervalles est la limite inférieure de la valeur ( X") dans le premier groupe.

Courbe de Lorenz, ou courbe de concentration, est appelée la courbe de concentration relative de la valeur totale de l'attribut. Il s'agit d'une ligne brisée dont les coordonnées des points sur l'axe des abscisses sont les fréquences relatives accumulées, et sur l'axe des ordonnées la valeur accumulée (total cumulé) de l'attribut Xj.

Plus la courbe de Lorenz est proche d'une droite, plus la répartition de la caractéristique est uniforme, c'est-à-dire la concentration est moindre. Plus la courbure de la courbe est grande, plus la répartition est inégale, c'est-à-dire la concentration est plus grande.

Graphiques statistiques. La classe de graphiques comprend principalement un histogramme (graphique à barres), ainsi que des graphiques à barres, des graphiques à ruban, des diagrammes circulaires, des diagrammes linéaires, des diagrammes carrés, des diagrammes circulaires, des diagrammes bouclés, etc.

Diagramme à bandes - il s'agit d'une figure en escalier constituée de rectangles dont les bases sont égales à la taille de l'intervalle dans le groupe et les hauteurs sont égales à la densité dans le groupe (absolue ou relative).

Lors de la construction de graphiques à barres, les données sont représentées sous forme de barres de même largeur mais de hauteurs différentes, en fonction de valeurs numériques quantités représentées à une certaine échelle.

Une variété de graphiques à barres sont des graphiques en bandes et en bandes. Ils représentent les dimensions d'un élément sous la forme de rectangles situés horizontalement de même largeur, mais de longueurs différentes, proportionnellement aux valeurs représentées. Le début des rayures doit être sur la même ligne verticale.

Camemberts Il est pratique de l'utiliser pour décrire la structure d'un phénomène ; dans ce cas, le cercle est divisé en secteurs proportionnels aux parts des parties du phénomène. Le cercle est pris dans son ensemble (100%) et est divisé en secteurs dont les arcs sont proportionnels

les valeurs des parties individuelles des quantités affichées. L'arc de chaque secteur (ou la valeur de l'angle au centre) est déterminé par la formule

où 360° est l'aire du cercle ;

d- la gravité spécifique du phénomène représenté en pourcentage.

Si les données statistiques sont présentées en valeurs absolues, alors la formule pour déterminer l'arc prend la forme :

b- l'ampleur du phénomène représenté en valeurs absolues.

Pour la construction circulaire Et diagrammes carrés il est nécessaire d'effectuer des calculs préalables, puisque les données statistiques disponibles (/)) correspondent aux aires de formes géométriques (cercles ou carrés).

Pour construire un cercle, vous devez trouver le rayon du cercle à l'aide de la formule

Pour construire un carré, vous devez trouver le côté du carré en fonction de la formule de l'aire d'un carré :

Signe barbare utilisé pour caractériser visuellement trois quantités interdépendantes - il s'agit d'un rectangle dans lequel la base est un indicateur, la hauteur en est un autre, et le produit de la base et de la hauteur caractérise la valeur du troisième indicateur dérivé.

Graphiques de formes sont construits de deux manières : les grandeurs statistiques comparées (/)) sont représentées par des chiffres - des symboles de différentes tailles proportionnellement aux volumes de ces agrégats, ou par un nombre différent de signes-symboles identiques, dont chacun reçoit un certain numéro numérique valeur.

Pour représenter graphiquement la distribution spatiale de tout indicateur statistique, des cartogrammes sont utilisés, qui peuvent être en arrière-plan ou en points.

Cartogramme est une combinaison d’un diagramme et d’une carte géographique.

Sur les cartogrammes de fond, la répartition du phénomène étudié sur le territoire est représentée par différentes colorations territoriales.

unités finales avec différentes densités de couleur ou des nuances d'intensité variable.

Sur un cartogramme à points, les symboles pour la représentation graphique des données statistiques sont des points situés au sein de certaines unités territoriales. Chaque point reçoit une valeur numérique spécifique.

Un cartogramme est utilisé dans les cas où il est nécessaire de montrer la répartition territoriale d'un élément statistique dans l'ensemble afin d'identifier le modèle de distribution de cet élément.

Méthodes automatisées pour construire des diagrammes. Des graphiques peuvent être créés de manière automatisée sur la base des données d'observation générées et regroupées dans un tableau. Pour garantir la clarté du schéma, le bloc de données doit répondre à certaines exigences :

  • les données doivent être systématisées par quantité et par groupes, colonnes et lignes ;
  • les données des différentes catégories doivent être comparables ;
  • les titres des tableaux, des lignes, des colonnes doivent être courts et clairs afin de ne pas prendre beaucoup de place et garantir une compréhension correcte de la signification du diagramme construit ;
  • Les données doivent être disposées dans une ou plusieurs plages rectangulaires avec des étiquettes de texte dans la rangée supérieure et dans la colonne de gauche.

Dans le cadre d'un package intégré Microsoft Office les informations de la feuille de calcul sont traitées à l'aide du programme Microsoft Excel. Une feuille de calcul est l’équivalent informatique d’une feuille de calcul ordinaire.

Processeur de table - programme spécial(progiciel) qui assure le traitement des informations présentées sous forme de tableau.

Microsoft Excel définit la première ligne de données, en commençant par la première cellule dans le coin supérieur gauche de la plage de données non-date sélectionnée existante et en se terminant par les lignes et colonnes sélectionnées restantes.

Pour créer des diagrammes dans le tableur, il est possible d'utiliser un assistant de diagramme spécial utilisant un traceur. MicrosoftGraph. L'Assistant Graphique se lance en cliquant sur l'icône dans la barre d'outils standard. Il est recommandé de sélectionner d'abord la plage de cellules contenant les données utilisées pour créer des graphiques. Les diagrammes sont construits en quatre étapes :

  • 1) choisir le type et le type de schéma ;
  • 2) clarification de la plage de données et disposition des lignes en lignes ou en colonnes. Le résultat de la construction d'un diagramme une fois positionné

les séries en lignes et en colonnes peuvent varier considérablement. Par défaut, la fenêtre affiche la vue graphique pour la plage de cellules sélectionnée. Si vous n'avez pas préalablement sélectionné les données, vous devez le faire dans cette fenêtre en cliquant sur l'icône du tableau stylisé dans le champ Gamme et en mettant en évidence les données dans le tableau. Languette "rangée" vous permet d'ajouter et de supprimer des lignes, de spécifier les plages dans lesquelles les lignes correspondantes sont présentées, les étiquettes des axes de catégories ;

  • 3) préciser le titre du schéma et compléter les signatures nécessaires ;
  • 4) placer le diagramme sur une feuille de calcul (sur la feuille de calcul actuelle ou séparée).

Pour modifier des éléments du graphique, vous devez double-cliquer, après quoi vous serez redirigé vers la fenêtre correspondante pour modifier les paramètres de l'élément sélectionné. Une aide importante est fournie par un menu contextuel qui peut être appelé sur des éléments individuels du diagramme.

Les données statistiques doivent être adaptées, d'une part, à l'objet d'étude, et d'autre part, au moment où elles sont collectées et utilisées.

Ce chapitre décrit les sources de données statistiques, leurs types et méthodes d'obtention, ainsi que les techniques de description et de présentation des données numériques et non numériques.

Après avoir étudié ce chapitre, VOUS devriez être capable de :

  • -construire un programme de recherche statistique;
  • -identifier les sources d'informations statistiques;
  • -résumer et regrouper les données statistiques et générer des tableaux statistiques ;
  • - afficher les résultats de regroupement sous forme de diagrammes ;
  • - évaluer les principales caractéristiques : valeur relative, valeur moyenne, dispersion, écart type, médiane, mode, étendue.

Obtention des données initiales

L'obtention d'informations sur l'objet d'étude est l'une des tâches principales de la recherche statistique.

La recherche statistique doit être guidée par les objectifs et les exigences des résultats. Ils déterminent les méthodes d'analyse statistique sur la base desquelles est organisée la collecte des données initiales. Dans le processus de recherche statistique, il faut se méfier des erreurs suivantes : les objectifs ne sont pas clairement formulés, les méthodes d'observation sont mal appliquées.

L'obtention des données initiales pour la recherche statistique peut se faire de deux manières :

  • -une expérience active, spécialement organisée pour déterminer les dépendances statistiques ;
  • -observation statistique.

L'expérimentation active est utilisée dans la recherche technique et économique, lorsque, par exemple, il s'agit d'optimiser les modes de processus technologiques selon des critères économiques.

Lorsqu'on mène une étude statistique des processus socio-économiques, il semble possible de n'utiliser que l'observation. Le programme est la base de cette méthode d'obtention d'informations. Il se compose de trois étapes principales :

  • -définition de l'objet de recherche ;
  • - sélection d'une unité de population ;
  • - détermination du système d'indicateurs à enregistrer.

L'objet d'observation est un ensemble d'unités du phénomène étudié, sur lesquelles des informations statistiques peuvent être collectées. Pour définir clairement l'objet d'observation, il convient de répondre aux questions suivantes :

  • -Quoi? (quels éléments allons-nous explorer) ;
  • -Où? (où l'observation sera effectuée _ ;
  • -Quand? (pour quelle période).

Du point de vue de l'organisation de l'observation statistique, il existe deux formes principales : le reporting et l'observation statistique spécialement organisée.

Le reporting en tant que forme d'observation se caractérise par le fait que les autorités statistiques reçoivent systématiquement des entreprises, des institutions et des organisations, dans un délai déterminé, des informations sur les conditions et les résultats des travaux de la période écoulée, dont le volume et le contenu sont déterminé par les formulaires de déclaration approuvés.

L'observation statistique spécialement organisée est la collecte d'informations sous la forme de recensements d'enregistrements et d'enquêtes ponctuels. Ils sont organisés pour étudier les phénomènes qui ne peuvent être couverts par une déclaration obligatoire.

Les types d'observation statistique se distinguent par l'heure d'enregistrement des données et le degré de couverture des unités de la population étudiée. En fonction de la nature de l'enregistrement des données au fil du temps, l'observation peut être classée :

  • -continu (par exemple, comptabilité des produits manufacturés) ;
  • -périodique (états comptables) ;
  • - ponctuelle, en cas de besoin d'information, par exemple un recensement de la population.

Selon le degré de couverture des unités de la population étudiée :

  • -incomplet, sélectif, lorsqu'on examine non pas la population entière, mais une partie de celle-ci ;
  • - continu, c'est-à-dire description de toutes les unités de la population ;
  • -monographique, lorsque des objets typiques sont décrits en détail.

Les principaux moyens d'obtenir des informations statistiques sont l'observation directe, les méthodes documentaires et les enquêtes.

La méthode d'observation directe se caractérise par le fait que les représentants des organismes statistiques de l'État ou d'autres organismes enregistrent les données dans des documents statistiques après inspection personnelle, recalcul, mesure ou pesée des unités d'observation.

Avec la méthode documentaire d'observation, divers documents servent de source. Cette méthode est utilisée lorsque les entreprises et les institutions établissent des rapports statistiques sur la base de documents comptables primaires.

Lors de la réalisation d'une enquête, la source d'information est constituée des réponses des répondants. L'enquête peut être organisée de différentes manières : par méthode d'expédition, par auto-inscription, par correspondance et par questionnaire.

Avec la méthode expédition, les représentants des organismes statistiques interrogent la personne interrogée et, à partir de ses propos, enregistrent les informations sur des fiches d'observation.

Dans la méthode d'auto-enregistrement, les unités interrogées (entreprises ou citoyens) reçoivent un formulaire d'enquête et des instructions sur la manière de le remplir. Les formulaires complétés sont envoyés par courrier dans le délai imparti.

Avec la méthode des correspondants, les informations sont communiquées aux organismes statistiques par des correspondants volontaires.

La méthode de collecte de données par questionnaire est basée sur le principe du remplissage volontaire des questionnaires par les destinataires.

Étapes de l'analyse quantitative. Analyse quantitative et idées sur l'objectivité Contrairement à la recherche qualitative, où les frontières sont floues non seulement entre l'étape d'analyse des données et l'étape d'interprétation conceptuelle des résultats obtenus, mais même entre les étapes de collecte et d'analyse des données empiriques...
(MÉTHODES QUALITATIVES ET QUANTITATIVES DE RECHERCHE EN PSYCHOLOGIE)
  • Calcul de statistiques descriptives
    Prenons un exemple d'analyse du marché des services éducatifs, à savoir les frais de scolarité dans les filières économiques dans les universités urbaines. Entrons-le sur la feuille de calcul dans Microsoft Données Excel tableau 5.25. Tableau 5.26 Répartition d'un groupe d'étudiants selon le montant du paiement des services éducatifs dans la région Coût...
    (Technologies de l'information en marketing)
  • Donnée statistique
    Au sein d'un groupe tarifaire homogène, on suppose que tous les objets présentent le même niveau de risque. Lors de sa mesure, des caractéristiques numériques telles que la probabilité d'un événement assuré, le montant attendu des paiements ou la gravité des pertes, etc. sont utilisées. Or, dans la vraie vie, l’assureur ne le fait pas…
    (Assurance)
  • Sources de statistiques démographiques
    La base d'informations sur les statistiques démographiques couvre un ensemble de sources de données démographiques. Parmi eux figurent les recensements, les enquêtes par sondage, les registres courants, les registres et banques de données automatisées, ainsi que les enquêtes anamnestiques. Le recensement de la population est une opération spéciale organisée scientifiquement...
    (Statistiques)
  • Analyse des données statistiques de Rosstat sur les accidents du travail dans la Fédération de Russie
    Pour la période 2000-2009 le nombre de victimes d'accidents du travail a diminué (tableau 7.1) de 151,8 à 46,1 mille personnes. par an, mais en 2010, il a augmenté de 1,6 mille personnes. Les blessures chez les hommes ont diminué de 116,7 mille à 32,2 mille personnes. par an, mais en 2010, il a augmenté de 1,2 mille personnes....
    (Sécurité des personnes. Théorie et pratique)
  • Critères de classification des données
    Dans le processus de gestion économique et systèmes techniques les méthodes statistiques nous permettent de prendre des décisions éclairées qui combinent l’intuition d’un spécialiste avec une analyse approfondie des informations disponibles. Dans ce cas, l'analyse des données peut être réalisée dans le but de : analyser et afficher les informations spécifiques collectées...
    (STATISTIQUES)
  • Type de données et critère de reproductibilité
    Le problème de l'objectivité des données psychologiques a des significations différentes dans la littérature. À bien des égards, les critères d’objectivité reprennent ceux qui n’ont pas été formulés spécifiquement pour le domaine de la connaissance psychologique. Le problème est en discussion reproductibilité des données, c'est-à-dire possibilité de recherches répétées avec obtention...
    (Psychologie expérimentale)
  • Les regroupements en statistiques judiciaires pénales permettent de donner les caractéristiques criminologiques et juridiques pénales les plus complètes et les plus complètes sur la base d'une grande variété de critères :

    • Ш par type - articles du Code pénal,
    • Sh sur l'objet de l'attaque,
    • Ш sur une base territoriale - district, région, région, république,
    • W ratio de crimes mercenaires et crimes violents,
    • Ш selon le moment de la commission des crimes, etc.),
    • L'identité des criminels (par sexe, âge, éducation, statut social, lieu de résidence, etc.),
    • Ш les causes et les conditions propices à la commission de délits, ainsi que les mesures de contrôle social et juridique sur ceux-ci.

    Dans le même temps, il est très important de comparer les différents regroupements de statistiques pénales non seulement entre eux, mais également avec des regroupements d'autres branches de statistiques (démographiques, socio-économiques, etc.), reflétant des phénomènes interdépendants.

    Les différences dans l'objectif du regroupement et les tâches qu'ils résolvent en analyse statistique s'expriment dans leur classification existante : typologique, structurelle, analytique.

    La tâche la plus importante des regroupements en statistique est de diviser la masse étudiée des unités de population en types caractéristiques, c'est-à-dire en groupes homogènes par leurs caractéristiques essentielles. Ce problème est résolu à l'aide d'un regroupement typologique.

    Regroupements typologiques- c'est la différenciation de la population étudiée en groupes homogènes, types selon une caractéristique qualitative essentielle.

    L'objectif principal d'un regroupement typologique est de distinguer un type de phénomène d'un autre par des moyens statistiques. Ce type de regroupement est largement déterminé par des idées établies sur les types de phénomènes qui constituent le contenu de la population étudiée.

    En statistique juridique, ce sont trois types de relations juridiques : le droit pénal, le droit administratif et le droit civil, qui en définissent les sections.

    Dans les statistiques criminelles en particulier, cela pourrait être, par exemple, la répartition par sexe des personnes ayant commis des crimes.

    Ce regroupement selon une caractéristique qualitative, lorsqu'il n'y a que deux valeurs de cette caractéristique, et que l'une d'elles exclut l'autre, est appelé alternatif en statistique.

    La séquence d'actions pour réaliser ce type de regroupement est élémentaire :

    • 1) le type de phénomène qui doit être mis en évidence est déterminé - dans notre cas, les délits enregistrés ;
    • 2) une caractéristique de regroupement est sélectionnée comme base pour décrire le type - dans notre cas, le sexe des personnes qui ont commis les crimes ;
    • 3) les limites des intervalles sont établies (dans notre cas, pour toutes les personnes identifiées comme ayant commis des délits) ;
    • 4) le regroupement est établi dans un tableau, les groupes sélectionnés (sur la base d'une combinaison de caractéristiques de regroupement) sont regroupés dans les types prévus et le nombre (densité spécifique) de chacun d'eux est déterminé.

    Lors du regroupement typologique, c'est-à-dire lors de la synthèse d'unités en catégories qualitativement homogènes, ces catégories doivent, comme indiqué, être déterminées sur la base des dispositions de la science pertinente et des normes de la loi. Par exemple, le regroupement des peines par type est effectué par les statistiques du droit pénal (judiciaire) en pleine conformité avec l'art. 43-59 du Code pénal, établissant de manière exhaustive les caractéristiques qualitatives exactes de leurs types individuels (amende, travail correctionnel, emprisonnement, etc.

    Regroupements structurels- c'est la répartition des groupes typiquement homogènes selon caractéristiques quantitatives, qui peut changer (varier). Dans la littérature scientifique, ce type de regroupement est parfois appelé variationnel. Avec leur aide, les statistiques criminelles étudient, par exemple, la structure des criminels selon diverses caractéristiques : âge, nombre de condamnations, durées d'emprisonnement, salaires et autres caractéristiques quantitatives.

    Un regroupement structurel ou variationnel de statistiques peut être effectué pour examiner la structure changeante de groupes généralement homogènes de crimes, de délinquants, de poursuites civiles et d'autres indicateurs. Pour le regroupement structurel de matériaux, il est nécessaire d'avoir des agrégats homogènes, divisés en fonction de la valeur de la caractéristique changeante (variante).

    Si le regroupement typologique est basé sur des caractéristiques qualitatives, alors le regroupement variationnel est basé sur des caractéristiques quantitatives (proportion de crimes, de personnes, de cas, âge des délinquants, peines, nombre de condamnations, nombre de cours terminés, montant des dommages, montant des réclamation, modalités d'enquête et d'examen des affaires pénales ou civiles).

    Les changements quantitatifs dans la structure des phénomènes étudiés sur plusieurs années indiquent des changements dans les tendances et modèles objectifs, dans la pratique d'enquête ou judiciaire et dans l'efficacité des activités des forces de l'ordre ou d'autres organes juridiques. En prenant, par exemple, les taux de condamnation absolus et relatifs sur plusieurs années, nous identifierons les tendances de la pratique judiciaire et ses relations avec la criminalité réelle. Après avoir étudié la dynamique du nombre absolu de crimes enregistrés d'un certain type, la dynamique de sa part dans la structure de tout crime, nous découvrirons les tendances dans l'évolution de cet acte.

    Des groupements structurels peuvent être construits sur la base de la répartition des délits par zones et objets d'empiétement criminel, sujets de la Fédération, régions et territoires.

    Les différences structurelles dans ce cas peuvent révéler les particularités de la situation criminologique dans une région particulière.

    Les regroupements structurels (variationnels) sont adjacents aux rangées de répartition des unités de population selon diverses caractéristiques.

    Regroupements analytiques- il s'agit d'une répartition selon la dépendance, le rapport entre deux ou plusieurs groupes hétérogènes de phénomènes ou leurs caractéristiques (par exemple, la répartition des vols par lieu et moment de leur commission ; les personnes reconnues coupables de délits automobiles - par l'expérience professionnelle du conducteur , etc.).

    Les regroupements analytiques revêtent une grande importance pour toutes les branches de la statistique juridique. Ils permettent d'identifier de nombreuses dépendances et relations cachées, ce qui est important pour la prise de décisions pratiques et le développement de la science juridique. D'autres types de regroupements, ainsi que d'autres techniques statistiques, ont également un potentiel analytique, mais le regroupement analytique lui-même poursuit directement l'établissement de dépendances entre les phénomènes étudiés. De par la nature de leurs tâches, les groupements corrélationnels sont proches du groupement analytique, lorsque la dépendance entre les phénomènes ou processus étudiés peut être mesurée de manière relativement précise.

    Tous les types de regroupements considérés sont généralement utilisés ensemble lors de l'analyse des aspects socio-juridiques, tortologiques et criminologiques. Par exemple, pour établir le danger social et la gravité des crimes commis, on peut diviser leur totalité en catégories d'actes et de formes de culpabilité (regroupement typologique). Pour déterminer l'efficacité de la lutte contre la criminalité des différents services répressifs (affaires intérieures, contrôle des drogues, service des douanes, parquet, service de sécurité), on peut étudier la variation du taux de détection des délits dans les départements mentionnés (regroupement de variations) .

    Afin d'établir les causes et les conditions de la croissance ou (diminution de la criminalité dans une ville, une région, un pays), un certain nombre de groupes analytiques doivent être appliqués.

    Méthodes statistiques

    Méthodes statistiques- les méthodes d'analyse des données statistiques. Il existe des méthodes de statistiques appliquées qui peuvent être utilisées dans tous les domaines de la recherche scientifique et dans tous les secteurs de l'économie nationale, ainsi que d'autres méthodes statistiques dont l'applicabilité est limitée à l'un ou l'autre domaine. Il s'agit de méthodes telles que le contrôle statistique d'acceptation, le contrôle statistique des processus technologiques, la fiabilité et les tests, ainsi que la planification d'expériences.

    Classification des méthodes statistiques

    Les méthodes statistiques d'analyse des données sont utilisées dans presque tous les domaines de l'activité humaine. Ils sont utilisés chaque fois qu'il est nécessaire d'obtenir et de justifier des jugements sur un groupe (objets ou sujets) présentant une certaine hétérogénéité interne.

    Il convient de distinguer trois types d'activités scientifiques et appliquées dans le domaine des méthodes statistiques d'analyse des données (selon le degré de spécificité des méthodes liées à l'immersion dans des problématiques spécifiques) :

    a) développement et recherche de méthodes à usage général, sans tenir compte des spécificités du domaine d'application ;

    b) développement et recherche de modèles statistiques de phénomènes et de processus réels conformément aux besoins d'un domaine d'activité particulier ;

    c) application de méthodes et de modèles statistiques pour l'analyse statistique de données spécifiques.

    Les statistiques appliquées

    Une description du type de données et du mécanisme de leur génération constitue le début de toute étude statistique. Des méthodes déterministes et probabilistes sont utilisées pour décrire les données. Grâce aux méthodes déterministes, il est possible d'analyser uniquement les données dont dispose le chercheur. Par exemple, avec leur aide, des tableaux ont été obtenus, calculés par les organismes statistiques officiels de l'État sur la base des rapports statistiques soumis par les entreprises et les organisations. Les résultats obtenus peuvent être transférés à une population plus large et utilisés à des fins de prévision et de contrôle uniquement sur la base d'une modélisation probabiliste-statistique. Par conséquent, seules les méthodes basées sur la théorie des probabilités sont souvent incluses dans les statistiques mathématiques.

    Nous ne considérons pas qu'il soit possible d'opposer les méthodes déterministes et probabilistes-statistiques. Nous les considérons comme des étapes séquentielles d’analyse statistique. Dans un premier temps, il est nécessaire d'analyser les données disponibles et de les présenter sous une forme facile à lire à l'aide de tableaux et de graphiques. Il convient alors d'analyser les données statistiques sur la base de certains modèles probabilistes et statistiques. Notez que la possibilité d'une compréhension plus approfondie de l'essence d'un phénomène ou d'un processus réel est assurée par le développement d'un modèle mathématique adéquat.

    Dans la situation la plus simple, les données statistiques sont les valeurs de certaines caractéristiques caractéristiques des objets étudiés. Les valeurs peuvent être quantitatives ou donner une indication sur la catégorie dans laquelle l'objet peut être classé. Dans le second cas, on parle d'un signe qualitatif.

    Lors de la mesure par plusieurs caractéristiques quantitatives ou qualitatives, nous obtenons un vecteur sous forme de données statistiques sur un objet. Cela peut être considéré comme un nouveau type de données. Dans ce cas, l’échantillon est constitué d’un ensemble de vecteurs. Il y a une partie des coordonnées - des nombres, et une partie - des données qualitatives (catégorisées), nous parlons alors d'un vecteur de différents types de données.

    Un élément de l’échantillon, c’est-à-dire une dimension, peut constituer la fonction dans son ensemble. Par exemple, l’électrocardiogramme du patient ou l’amplitude du battement de l’arbre moteur décrivent la dynamique de l’indicateur, c’est-à-dire son évolution dans le temps. Ou une série chronologique décrivant la dynamique des performances d’une entreprise particulière. Ensuite, l’échantillon se compose d’un ensemble de fonctions.

    Les éléments échantillons peuvent également être d’autres objets mathématiques. Par exemple, les relations binaires. Ainsi, lorsqu'ils interrogent des experts, ils utilisent souvent l'ordre (classement) des objets d'examen - échantillons de produits, projets d'investissement, options de décisions de gestion. Selon les règles de l'expertise, les éléments d'échantillonnage peuvent être différents types de relations binaires (ordonnancement, partitionnement, tolérance), d'ensembles, d'ensembles flous, etc.

    Ainsi, la nature mathématique des éléments de l'échantillon dans divers problèmes de statistiques appliquées peut être très différente. Cependant, deux classes de données statistiques peuvent être distinguées : numériques et non numériques. En conséquence, les statistiques appliquées sont divisées en deux parties : les statistiques numériques et les statistiques non numériques.

    Les statistiques numériques sont des nombres, des vecteurs, des fonctions. Ils peuvent être additionnés et multipliés par des coefficients. Par conséquent, dans les statistiques numériques, diverses sommes sont d'une grande importance. L'appareil mathématique permettant d'analyser les sommes d'éléments aléatoires d'un échantillon est constitué des lois (classiques) des grands nombres et des théorèmes centraux limites.

    Les données statistiques non numériques sont des données catégorisées, des vecteurs de différents types de caractéristiques, des relations binaires, des ensembles, des ensembles flous, etc. Elles ne peuvent pas être additionnées et multipliées par des coefficients. Par conséquent, cela n’a aucun sens de parler de sommes de statistiques non numériques. Ce sont des éléments d'espaces mathématiques non numériques (ensembles). L'appareil mathématique d'analyse de données statistiques non numériques repose sur l'utilisation de distances entre éléments (ainsi que de mesures de proximité, indicateurs de différence) dans de tels espaces. À l'aide de distances, des moyennes empiriques et théoriques sont déterminées, les lois des grands nombres sont prouvées, des estimations non paramétriques de la densité de distribution de probabilité sont construites, des problèmes de diagnostic et une analyse groupée sont résolus, etc. (voir).

    La recherche appliquée utilise différents types de données statistiques. Cela est dû notamment aux modalités d’obtention de ceux-ci. Par exemple, si les tests de certains dispositifs techniques se poursuivent jusqu'à un certain moment, nous obtenons ce qu'on appelle. données censurées constituées d'un ensemble de chiffres - la durée de fonctionnement d'un certain nombre d'appareils avant la panne et des informations indiquant que les appareils restants ont continué à fonctionner à la fin du test. Les données censurées sont souvent utilisées pour évaluer et surveiller la fiabilité des appareils techniques.

    En règle générale, les méthodes statistiques d'analyse des données des trois premiers types sont considérées séparément. Cette limitation est due au fait mentionné ci-dessus que l'appareil mathématique permettant d'analyser des données de nature non numérique est très différent de celui utilisé pour les données sous forme de nombres, de vecteurs et de fonctions.

    Modélisation probabiliste-statistique

    En appliquant les méthodes statistiques dans des domaines spécifiques de la connaissance et des secteurs de l'économie nationale, on obtient des disciplines scientifiques et pratiques telles que « méthodes statistiques dans l'industrie », « méthodes statistiques en médecine », etc. De ce point de vue, l'économétrie est « la statistique méthodes en économie ». Ces disciplines du groupe b) sont généralement basées sur des modèles probabilistes-statistiques construits en fonction des caractéristiques du domaine d'application. Il est très instructif de comparer les modèles probabilistes-statistiques utilisés dans différents domaines, de découvrir leurs similitudes et en même temps de constater certaines différences. Ainsi, on peut constater la similitude des énoncés de problèmes et des méthodes statistiques utilisées pour les résoudre dans des domaines tels que la recherche scientifique médicale, la recherche sociologique spécifique et la recherche marketing, ou, en bref, en médecine, sociologie et marketing. Celles-ci sont souvent regroupées sous le nom d'« études types ».

    La différence entre les études par sondage et les études d'experts se manifeste tout d'abord dans le nombre d'objets ou de sujets interrogés - dans les études par sondage, on parle généralement de centaines, et dans les études d'experts - d'environ des dizaines. Mais la technologie de la recherche experte est beaucoup plus sophistiquée. La spécificité est encore plus prononcée dans les modèles démographiques ou logistiques, lors du traitement d'informations narratives (texte, chronique) ou lors de l'étude de l'influence mutuelle de facteurs.

    Les questions de fiabilité et de sécurité des dispositifs et technologies techniques, la théorie des files d'attente sont abordées en détail dans un grand nombre d'ouvrages scientifiques.

    Analyse statistique de données spécifiques

    L'application de méthodes et de modèles statistiques pour l'analyse statistique de données spécifiques est étroitement liée aux problèmes du domaine concerné. Les résultats du troisième des types identifiés d'activités scientifiques et appliquées se situent à l'intersection des disciplines. Ils peuvent être considérés comme des exemples d’application pratique des méthodes statistiques. Mais il n'y a pas moins de raisons de les attribuer au domaine correspondant de l'activité humaine.

    Par exemple, les résultats d’une enquête auprès des consommateurs de café instantané sont naturellement attribués au marketing (c’est ce qu’ils font lorsqu’ils donnent des conférences sur la recherche marketing). L'étude de la dynamique de croissance des prix à l'aide d'indices d'inflation calculés à partir d'informations collectées de manière indépendante présente un intérêt principalement du point de vue de l'économie et de la gestion de l'économie nationale (à la fois au niveau macro et au niveau des organisations individuelles).

    Perspectives de développement

    La théorie des méthodes statistiques vise à résoudre des problèmes réels. Par conséquent, de nouvelles formulations de problèmes mathématiques pour l'analyse de données statistiques y apparaissent constamment, et de nouvelles méthodes sont développées et justifiées. La justification est souvent réalisée par des moyens mathématiques, c'est-à-dire en démontrant des théorèmes. Un rôle majeur est joué par la composante méthodologique - comment poser exactement les problèmes, quelles hypothèses accepter dans le but d'une étude mathématique plus approfondie. Le rôle du moderne technologies de l'information, en particulier, une expérience informatique.

    Une tâche urgente consiste à analyser l'histoire des méthodes statistiques afin d'identifier les tendances de développement et de les appliquer à des fins de prévision.

    Littérature

    2. Naylor T. Expériences de simulation de machines avec des modèles de systèmes économiques. - M. : Mir, 1975. - 500 p.

    3. Kramer G. Méthodes mathématiques de statistiques. - M. : Mir, 1948 (1ère éd.), 1975 (2e éd.). - 648 p.

    4. Bolshev L. N., Smirnov N. V. Tableaux de statistiques mathématiques. - M. : Nauka, 1965 (1ère éd.), 1968 (2e éd.), 1983 (3e éd.).

    5. Smirnov N. V., Dunin-Barkovsky I. V. Cours de théorie des probabilités et de statistiques mathématiques pour les applications techniques. Éd. Troisièmement, stéréotypé. - M. : Nauka, 1969. - 512 p.

    6. Norman Draper, Harry Smith Analyse de régression appliquée. Régression multiple = Analyse de régression appliquée. - 3e éd. - M. : « Dialectique », 2007. - P. 912. - ISBN 0-471-17082-8

    Voir également

    Fondation Wikimédia. 2010.

    • Yat-Kha
    • Amalgame (homonymie)

    Voyez ce que sont les « méthodes statistiques » dans d'autres dictionnaires :

      MÉTHODES STATISTIQUES- MÉTHODES STATISTIQUES méthodes scientifiques de description et d'étude des phénomènes de masse permettant une expression quantitative (numérique). Le mot « statistiques » (de Igal. stato state) a une racine commune avec le mot « état ». Au départ, c'est... ... Encyclopédie philosophique

      MÉTHODES STATISTIQUES -- des méthodes scientifiques de description et d'étude des phénomènes de masse permettant une expression quantitative (numérique). Le mot « statistiques » (de l’italien stato – État) a une racine commune avec le mot « État ». Initialement, cela concernait la science de la gestion et... Encyclopédie philosophique

      Méthodes statistiques- (en écologie et biocénologie) les méthodes de statistiques de variation, qui permettent d'étudier l'ensemble (par exemple phytocénose, population, productivité) selon ses agrégats partiels (par exemple, d'après les données obtenues sur les sites d'enregistrement) et d'évaluer la Degré de précision... ... Dictionnaire écologique

      Méthodes statistiques- (en psychologie) (du latin status state) certaines méthodes de statistiques mathématiques appliquées, utilisées en psychologie principalement pour le traitement des résultats expérimentaux. L'objectif principal de l'utilisation de S. m. est d'augmenter la validité des conclusions dans ... ... Grande encyclopédie psychologique

      Méthodes statistiques- 20.2. Méthodes statistiques Les méthodes statistiques spécifiques utilisées pour organiser, réglementer et tester les activités comprennent, sans s'y limiter : a) la conception d'expériences et l'analyse factorielle ; b) analyse de variance et... Dictionnaire-ouvrage de référence des termes de la documentation normative et technique

      MÉTHODES STATISTIQUES- les méthodes d'étude des quantités. aspects des sociétés de masse. phénomènes et processus. Les S.m. permettent de caractériser numériquement les mutations en cours des sociétés. processus, étudier divers. formes de socio-économiques. modèles, changement... ... Dictionnaire encyclopédique agricole

      MÉTHODES STATISTIQUES- quelques méthodes de statistiques mathématiques appliquées utilisées pour traiter les résultats expérimentaux. Un certain nombre de méthodes statistiques ont été développées spécifiquement pour tester la qualité des tests psychologiques, destinés à être utilisés dans des contextes professionnels... ... Formation professionnelle. Dictionnaire

      MÉTHODES STATISTIQUES- (en psychologie de l'ingénieur) (du latin status state) certaines méthodes de statistiques appliquées utilisées en psychologie de l'ingénieur pour traiter les résultats expérimentaux. L'objectif principal de l'utilisation de S. m. est d'augmenter la validité des conclusions dans ... ... Dictionnaire encyclopédique de psychologie et de pédagogie

    mob_info