
Data Mining et statistique décisionnelle. La science des données, 5e édition revue et augmentée
Le data mining et la data science sont de plus en plus répandus dans les entreprises et les organisations soucieuses d'extraire l'information pertinente de leurs bases de données, qu'elles peuvent utiliser pour expliquer et prévoir les phénomènes qui les concernent (risques, production, consommation, fidélisation...). Cette cinquième édition, actualisée et augmentée de 90 pages, fait le point sur le data mining, ses méthodes, ses outils et ses applications, qui vont du scoring jusqu'au text mining, objet d'un chapitre complètement remanié. Nombre de ses outils appartiennent à l'analyse des données et à la statistique "classiques" (analyse factorielle, classification automatique, analyse discriminante, régression logistique, modèles linéaires généralisés, régression pénalisée, régression clusterwise...) mais certains sont plus spécifiques au data mining, comme les réseaux de neurones, les algorithmes génétiques, les SVM, les arbres de décision, les forêts aléatoires, le boosting et la détection des règles d'associations. Les avancées les plus récentes du machine learning et les applications les plus actuelles des Big Data sont présentées, qui vont des algorithmes de reconnaissance d'image aux méthodes de plongement de mots en text mining. Les chapitres sur les réseaux de neurones et les SVM sont illustrés par la reconnaissance de l'écriture manuscrite. Ces outils sont disponibles dans des logiciels de plus en plus puissants et complets, à commencer par le logiciel libre R, que nous comparons en détail aux logiciels SAS et IBM SPSS dans un chapitre spécifique. Ces logiciels sont utilisés pour illustrer par des exemples précis les explications théoriques données. Les aspects méthodologiques vont de la conduite des projets jusqu'aux facteurs de réussite et aux pièges à éviter, en passant par l'évaluation et la comparaison des modèles, leur intégration dans les processus opérationnels. Un chapitre est consacré à une étude de cas complète de credit scoring, de l'exploration des données jusqu'à l'élaboration de la grille de score.
| Nombre de pages | 914 |
|---|---|
| Date de parution | 14/10/2017 |
| Poids | 1 569g |
| Largeur | 171mm |
| SKU: | 9782710811800 |
| wmi_id_distributeur: | Not set |
| Is Salable (from plugin): | No (Out of Stock) |
| Is Salable (direct MSI check): | No (Out of Stock) |
| Distributor Name: | Par défaut |
| Availability Value: | 0 |
| Availability Label: | Epuisé |
| Match Result: | |
| Default Availability (Config): | 0 - Epuisé |
| Raw Config Mapping: |
Array
(
[_1772119784121_121] => Array
(
[id] => 12707000
[name] => 12707000
[availability] => 1
[activation_attribute] => 1
)
)
|
| EAN | 9782710811800 |
|---|---|
| Titre | Data Mining et statistique décisionnelle. La science des données, 5e édition revue et augmentée |
| Auteur | Tufféry Stéphane |
| Editeur | TECHNIP |
| Largeur | 171 |
| Poids | 1569 |
| Date de parution | 20171014 |
| Nombre de pages | 914,00 € |
Pourquoi choisir Molière ?
Du même auteur
-

Data Science, statistique et machine learning. 6e édition actualisée
Tufféry Stéphane ; Saporta GilbertÉPUISÉVOIR PRODUIT69,00 € -

Etude de cas en statistique décisionnelle. 2e édition revue et augmentée
Tufféry StéphaneComprendre les principes théoriques de la statistique est une chose ; savoir les mettre en pratique en est une autre, et le fossé peut être large entre les deux. C'est pour vous aider à le franchir que l'auteur a écrit un ouvrage de "travaux pratiques" de la statistique décisionnelle et de la data science, qui fait suite à son ouvrage Data Mining et Statistique Décisionnelle paru dans la même collection. Ce nouvel ouvrage présente une étude de cas réalisée de A à Z à partir du même jeu de données, et répondant de façon complète et cohérente à deux importantes problématiques : la construction d'une segmentation de clientèle et l'élaboration d'un score d'appétence à l'achat d'un produit ou la souscription d'un contrat. Les données utilisées sont à la fois réelles et complètes. Elles proviennent du secteur de l'assurance, mais l'étude qu'elles permettent de réaliser peut se transposer a de nombreux autres domaines. Ces données sont disponibles sur le Web, notamment sur le site des Editions Technip où elles sont accompagnées des programmes présentés dans l'ouvrage. Ceci permettra au lecteur de compléter sa lecture par des exercices personnels, par le test de variantes, mais aussi d'utiliser ces programmes pour les appliquer à ses propres données et ses propres projets. L'étude de cas est menée avec le logiciel SAS, qui est à la fois le plus complet et le plus répandu des logiciels statistiques commerciaux, et qui permet de traiter tous les sujets abordés dans l'ouvrage, et même d'optimiser et d'automatiser les traitements. Tout au long de l'ouvrage, une bonne partie des procédures classiques de SAS/STAT est passée en revue, en mentionnant les améliorations des versions récentes, mais, au-delà des questions de programmation, nous souhaitons surtout montrer au lecteur qu'il est souhaitable et possible de conjuguer rigueur et productivité. Pour le scoring, quatre méthodes classiques de modélisation sont mises en oeuvre et comparées, l'analyse discriminante linéaire, les arbres de décision, la régression logistique et le classificateur bayésien naïf, de même que le bagging et deux méthodes plus avancées mises en oeuvre par l'appel de code R dans le programme SAS : les forêts aléatoires et le gradient boosting.ÉPUISÉVOIR PRODUIT45,00 € -

Tendances actuelles de la jurisprudence matrimoniale dans les tribunaux d'Eglise. Approches comparée
Aoun Marc ; Tuffery-Andrieu Jeanne-MarieLe présent ouvrage réunit les communications présentées à la Journée d'études organisée par l'Institut de droit canonique et le Centre PRISMEUMR7012 de l'Université de Strasbourg, qui s'est tenue le 27 novembre 2009 afin de faire le point, dans une perspective comparée, sur les tendances actuelles de la jurisprudence matrimoniale dans les tribunaux de l'Eglise. Les évolutions actuelles qui orientent, sous différents angles, les décisions des juridictions compétentes sont examinées dans une double approche comparative : d'une part à travers la confrontation de l'application des dispositions qui régissent, en matière de nullité de mariage, l'Eglise latine et les Eglises orientales catholiques, et d'autre part au prisme de l'intervention des divers degrés de tribunaux : Signature Apostolique, Rote romaine, officialités diocésaines. Les contributions rassemblées dans ce volume entendent aider à soutenir la réflexion de tous ceux qui, au sein des tribunaux ecclésiastiques, oeuvrent à la promotion d'une correcte administration de la justice dans l'Eglise.ÉPUISÉVOIR PRODUIT52,75 € -

Modélisation prédictive et apprentissage statistique avec R
Tufféry StéphaneCet ouvrage présente les principales méthodes de modélisation statistique et de machine learning, à travers le fil conducteur d'une étude de cas bancaire. Chaque méthode fait l'objet d'un rappel de cours et est accompagnée de références bibliographiques, puis est mise en couvre avec des explications détaillées sur les calculs effectués, les interprétations des résultats, et jusqu'aux astuces de programmation permettant d'optimiser les temps de calcul. A ce sujet, une annexe est consacrée au traitement des données massives. L'ouvrage commence par les méthodes de classement les plus classiques et les plus éprouvées, pour ensuite aborder les méthodes les plus récentes et les plus avancées régression ridge, lasso, elastic net, boosting, forêts aléatoires, Extra-Trees, SVM et réseaux de neurones. Le lien est toujours fait entre la théorie et les résultats obtenus, pour montrer qu'ils illustrent bien les principes sous-jacents à ces méthodes. L'aspect pratique est aussi privilégié, avec l'objectif de permettre au lecteur une mise en oeuvre rapide et efficace dans son travail concret. L'exploration et la préparation des données sont d'ailleurs décrites, ainsi que le processus de sélection des variables. Une synthèse finale récapitule les méthodes présentées et leurs points forts. Entre autres nouveautés, cette troisième édition présente le gradient boosting ainsi que des techniques innovantes pour automatiser la recherche des meilleurs modèles (auto-machine learning) et expliquer leurs prédictions individuelles, souci d'explicabilité qui s'est développé avec l'avènement des modèles complexes "boites noires". La mise en couvre s'appuie sur le logiciel libre R et sur un jeu de données public. Ce dernier peut être téléchargé sur Internet et présente l'intérêt d'être représentatif et de permettre des comparaisons grâce aux nombreuses publications dans lesquelles il est cité. Quant au logiciel R, s'il est devenu la lingua franca de la statistique et un logiciel très répandu dans le monde universitaire, il a aussi conquis le monde de l'entreprise. Outre qu'il est disponible pour tous, dans tous les environnements, il est aussi le plus complet statistiquement et il permet de mettre en couvre toutes les méthodes présentées dans cet ouvrage. Enfin, son langage de programmation particulièrement élégant et adapté au calcul mathématique permet de se concentrer sur les aspects statistiques dans le codage. R permet d'arriver directement à l'essentiel et de mieux assimiler les méthodes exposées dans l'ouvrage.ÉPUISÉVOIR PRODUIT45,95 €
Du même éditeur
-
Stratigraphy. Terminology and practice
Rey Jacques ; Galeotti SimoneThis book, written by 33 stratigraphic experts, presents various processes available which will enable the location in time of all rock types: sedimentary, metamorphic, plutonic, and eruptive, whether they are in outcrop or at subsurface. The terminology and the appropriate practices for each method are presented in separate chapters and illustrated with concrete examples. The order of the chapters is modeled on the progression of the stratigraphic process, from the descriptive to the interpretative, from the methods of the geometric stratigraphy (lithostratigraphy and genetic stratigraphy, chemostratigraphy, magnetostratigraphy) to the chronological stratigraphy (biostratigraphy), followed by the chronometric stratigraphy (isotopic geochronology). The final two chapters are dedicated to chronostratigraphic units and correlations which combine the contributions of various methods and to the presentation of the 2007 version of the Geological Time Scale. The definitions of stratigraphic terms can be found in a glossary at the end of the work. The book is addressed to all professional geologists, from the industrial sector as well as those in universities, including teachers and researchers who would like to deepen their knowledge of the vocabulary, the concepts, the methods and the practical applications of different approaches of stratigraphy, a reference discipline for the entirety of the geological sciences.ÉPUISÉVOIR PRODUIT70,00 € -
Charbon. Les métamorphoses d'une industrie
Martin-Amouroux Jean-MarieRésumé : Aux yeux de la plupart des Européens, le charbon minéral n'est plus une source d'énergie qui compte. Erreur ! Sa consommation croît si vite et ses réserves sont si abondantes qu'il pourrait passer un jour devant le pétrole. Le climat planétaire n'y gagnera rien, sauf si les technologies " charbon propre " font un bond. Quels sont les ressorts de cette croissance charbonnière ? Les embûches rencontrées par le nucléaire et la hausse des prix du gaz naturel la favorisent, mais elles ne doivent pas faire oublier la métamorphose de l'industrie du charbon dans le monde. De la Chine, leader mondial incontesté, aux États-Unis, en passant par l'Inde, la Russie et les grands pays exportateurs (Australie, Indonésie, Afrique du Sud, Colombie), une nouvelle carte se dessine. Dans tous ces pays, les firmes charbonnières se concentrent, s'internationalisent, ouvrent de nouvelles mines à ciel ouvert et tracent de nouveaux itinéraires commerciaux. La compréhension de cette métamorphose devient l'une des clés de la prospective énergétique et de la géopolitique du XXIe siècle.ÉPUISÉVOIR PRODUIT35,00 € -
Probabilités. Exercices corrigés
Ghorbanzadeh DariushCet ouvrage est le fruit d'une longue expérience d'enseignement des probabilités-statistiques au sein de l'Institut d'Informatique d'Entreprise et de l'ESCPI Ingénieurs 2000 (CNAM). Il s'adresse aux élèves des écoles d'ingénieur, aux étudiants en mathématiques appliquées et aux ingénieurs et techniciens non-spécialistes en la matière. Son contenu et sa forme pédagogique facilitent l'assimilation de la théorie probabiliste, en particulier de certains thèmes difficiles tels le calcul de loi, le conditionnement et les notions d'asymptotique. Le livre introduit également au domaine des applications en statistiques et en fiabilité. Après des rappels de cours, les exercices abordent des sujets classiques comme les lois usuelles et les vecteurs gaussiens et d'autres plus spécifiques comme la détection de rupture, sujet actuellement leader en matière de recherche.ÉPUISÉVOIR PRODUIT32,00 € -
Probabilités, analyse des données et statistique. 3e édition
Saporta GilbertLa démarche statistique n'est pas seulement une auxiliaire des sciences destinée à valider ou non des modèles préétablis, c'est aussi une méthodologie indispensable pour extraire des connaissances à partir de données et un élément essentiel pour la prise de décision. La très large diffusion d'outils informatiques peut donner l'illusion de la facilité à ceux qui n'en connaissent pas les limites, alors que la statistique est plus que jamais un mode de pensée fondamental pour maîtriser la complexité, l'aléatoire et les risques, en donnant la prudence scientifique nécessaire. Ce manuel présente l'ensemble des connaissances utiles pour pouvoir pratiquer la statistique. Il est destiné à un vaste public (étudiants, chercheurs, praticiens de toutes disciplines) possédant le niveau d'algèbre et d'analyse d'un premier cycle universitaire scientifique ou économique. Cette nouvelle édition est une révision complète, avec des ajouts, de l'édition de 1990 et comporte de nombreux développements sur des méthodes récentes. Les 21 chapitres sont structurés en cinq parties: outils probabilistes, analyse exploratoire, statistique inférentielle, modèles prédictifs et recueil de données. On y trouve l'essentiel de la théorie des probabilités, les différentes méthodes d'analyse exploratoire des données (analyses factorielles et classification), la statistique "classique" avec l'estimation et les tests mais aussi les méthodes basées sur la simulation, la régression linéaire et logistique ainsi que des techniques non linéaires, la théorie des sondages et la construction de plans d'expériences.ÉPUISÉVOIR PRODUIT66,00 €
De la même catégorie
-
Modélisation statistique appliquée aux sciences sociales. Edition revue et corrigée
Bressoux PascalPrincipes, applications et interprétations de différentes techniques de modélisation statistique, classiques ou avancées, linéaires ou non linéaires, incluant les modèles par les moindres carrés ordinaires, les modèles logit (logistiques), les modèles multiniveaux (hiérarchiques). Méthodologie progressive, avec de nombreux exemples Logiciels utilisés: MLwin et SAS (transposable en SPSS). Illustré par des tableaux et des captures d'écrans. Nouvelle édition incluant en téléchargement des exercices d'entraînement sur les bases de données et les programmes SAS ou SPSS de mise en oeuvre des analyses. Destiné aux étudiants et chercheurs en sciences de l'éducation, économie, psychologie, STAPS (sciences et techniques des activités physiques et sportives), méthodologie statistique, sociologie, démographique, géographique, agronomie et biologie.ÉPUISÉVOIR PRODUIT39,90 € -
Probabilités
Carassus LaurenceCe manuel couvre l'ensemble du programme de Probabilités enseigné dans les différentes filières de mathématiques en L3 et M1. L'ouvrage est accessible à un large public, par exemple pour les élèves des écoles d'ingénieurs, qui n'ont pas vu de théorie de la mesure en classes prépas), où les candidats CAPES de mathématiques puisque les rappels sur le sujet font partie intégrante du projet, rendant ainsi l'ouvrage autosuffisant. Basé sur l'acquisition des données, chaque notion est illustrée par des exercices et problèmes transversaux adaptés. En fin de chapitres, les principaux résultats sont résumés dans des fiches de synthèses.ÉPUISÉVOIR PRODUIT27,90 € -
Comprendre et réaliser les tests statistiques à l'aide de R. Manuel de biostatistique, 4e édition
Millot GaëlCe livre s'adresse aux étudiants, médecins et chercheurs désirant réaliser des tests alors qu'ils débutent en statistique. Une approche simple et détaillée : illustré par 88 figures et accompagné d'exercices avec correction, l'ouvrage aborde la statistique de la manière la plus simple qui soit, sans démonstration mathématique, mais en insistant sur les détails, afin de bien maîtriser toutes les subtilités des tests. Des notions essentielles traitées en profondeur : l'ouvrage explore des points fondamentaux en statistique : la check-list à effectuer avant de réaliser un test, la gestion des individus extrêmes, l'origine de la p value, la puissance ou la conclusion d'un test. Il explique comment choisir un test à partir de ses propres données. Il décrit 35 tests statistiques sous forme de fiches, dont 24 non paramétriques, ce qui couvre la plupart des tests à une ou deux variables observées. Il traite de toutes les subtilités des tests, comme les corrections de continuité, les corrections de Welch pour le test t et l'anova, ou les corrections de p value lors des comparaisons multiples. Il propose un exemple d'application de chaque test à l'aide de R, en incluant toutes les étapes du test, et notamment l'analyse graphique des données. R, le logiciel de référence : l'originalité de ce manuel est de proposer non seulement une explication très détaillée sur l'utilisation des tests les plus classiques, mais aussi la possibilité de réaliser ces tests à l'aide de R, logiciel de référence en statistique, gratuit, disponible sur Internet et compatible avec Windows, Mac OS et Linux. L'autre originalité est de proposer l'ensemble des exemples d'application des tests à partir d'un seul fichier de données, ce qui facilite la compréhension et le passage éventuel vers d'autres logiciels d'analyse. Ce fichier, ainsi que l'intégralité du code R de ce manuel, est disponible en ligne.ÉPUISÉVOIR PRODUIT39,00 € -
Statitiques appliquées. Avec introduction au logiciel R
Marchal OlivierDans cet ouvrage inspiré de son expérience d'enseignant, l'auteur présente, pour un public non spécialiste des mathématiques, les bases des statistiques appliquées modernes ainsi que leur implémentation dans le logiciel libre R. L'ouvrage aborde ainsi l'aspect descriptif des statistiques (représentations graphiques, moyenne, écarts-types empiriques, etc.) puis les intervalles de confiance, les tests d'hypothèses paramétriques et non-paramétriques, les régressions linéaires et les tests ANOVA, qui constituent les outils indispensables de l'analyse de données expérimentales. Illustré d'exemples types et de nombreux exercices intégralement corrigés, il permet une approche pratique sans négliger le cadre d'emploi ainsi que les limites propres à chaque outil. Destiné à des étudiants de Licence ou à toute personne souhaitant acquérir rapidement les techniques modernes de statistiques nécessaires afin de réaliser des analyses de données, il propose également, sans technicité excessive, les commandes en R permettant de réaliser chacun des outils abordés et de les adapter rapidement à des cas similaires. Ainsi, il apparaît particulièrement indiqué dans le cadre de la réalisation d'analyses de données pour un stage, un mémoire ou une thèse dans les domaines de la biologie, de la médecine, de la sociologie ou de tout autre domaine des sciences appliquées.ÉPUISÉVOIR PRODUIT28,01 €






