scholarly journals Differentially Private Iterative Gradient Hard Thresholding for Sparse Learning

Author(s):  
Lingxiao Wang ◽  
Quanquan Gu

We consider the differentially private sparse learning problem, where the goal is to estimate the underlying sparse parameter vector of a statistical model in the high-dimensional regime while preserving the privacy of each training example. We propose a generic differentially private iterative gradient hard threshoding algorithm with a linear convergence rate and strong utility guarantee. We demonstrate the superiority of our algorithm through two specific applications: sparse linear regression and sparse logistic regression. Specifically, for sparse linear regression, our algorithm can achieve the best known utility guarantee without any extra support selection procedure used in previous work \cite{kifer2012private}. For sparse logistic regression, our algorithm can obtain the utility guarantee with a logarithmic dependence on the problem dimension.  Experiments on both synthetic data and real world datasets verify the effectiveness of our proposed algorithm.

2020 ◽  
Vol 34 (04) ◽  
pp. 6235-6242
Author(s):  
Lingxiao Wang ◽  
Quanquan Gu

We study the problem of estimating high dimensional models with underlying sparse structures while preserving the privacy of each training example. We develop a differentially private high-dimensional sparse learning framework using the idea of knowledge transfer. More specifically, we propose to distill the knowledge from a “teacher” estimator trained on a private dataset, by creating a new dataset from auxiliary features, and then train a differentially private “student” estimator using this new dataset. In addition, we establish the linear convergence rate as well as the utility guarantee for our proposed method. For sparse linear regression and sparse logistic regression, our method achieves improved utility guarantees compared with the best known results (Kifer, Smith and Thakurta 2012; Wang and Gu 2019). We further demonstrate the superiority of our framework through both synthetic and real-world data experiments.


Author(s):  
Yi Sun ◽  
Alfredo Cuesta-Infante ◽  
Kalyan Veeramachaneni

A vine copula model is a flexible high-dimensional dependence model which uses only bivariate building blocks. However, the number of possible configurations of a vine copula grows exponentially as the number of variables increases, making model selection a major challenge in development. In this work, we formulate a vine structure learning problem with both vector and reinforcement learning representation. We use neural network to find the embeddings for the best possible vine model and generate a structure. Throughout experiments on synthetic and real-world datasets, we show that our proposed approach fits the data better in terms of loglikelihood. Moreover, we demonstrate that the model is able to generate high-quality samples in a variety of applications, making it a good candidate for synthetic data generation.


2021 ◽  
Vol 22 (1) ◽  
Author(s):  
João Lobo ◽  
Rui Henriques ◽  
Sara C. Madeira

Abstract Background Three-way data started to gain popularity due to their increasing capacity to describe inherently multivariate and temporal events, such as biological responses, social interactions along time, urban dynamics, or complex geophysical phenomena. Triclustering, subspace clustering of three-way data, enables the discovery of patterns corresponding to data subspaces (triclusters) with values correlated across the three dimensions (observations $$\times$$ × features $$\times$$ × contexts). With increasing number of algorithms being proposed, effectively comparing them with state-of-the-art algorithms is paramount. These comparisons are usually performed using real data, without a known ground-truth, thus limiting the assessments. In this context, we propose a synthetic data generator, G-Tric, allowing the creation of synthetic datasets with configurable properties and the possibility to plant triclusters. The generator is prepared to create datasets resembling real 3-way data from biomedical and social data domains, with the additional advantage of further providing the ground truth (triclustering solution) as output. Results G-Tric can replicate real-world datasets and create new ones that match researchers needs across several properties, including data type (numeric or symbolic), dimensions, and background distribution. Users can tune the patterns and structure that characterize the planted triclusters (subspaces) and how they interact (overlapping). Data quality can also be controlled, by defining the amount of missing, noise or errors. Furthermore, a benchmark of datasets resembling real data is made available, together with the corresponding triclustering solutions (planted triclusters) and generating parameters. Conclusions Triclustering evaluation using G-Tric provides the possibility to combine both intrinsic and extrinsic metrics to compare solutions that produce more reliable analyses. A set of predefined datasets, mimicking widely used three-way data and exploring crucial properties was generated and made available, highlighting G-Tric’s potential to advance triclustering state-of-the-art by easing the process of evaluating the quality of new triclustering approaches.


Healthcare ◽  
2021 ◽  
Vol 9 (7) ◽  
pp. 853
Author(s):  
Jee-Yun Kim ◽  
Jeong Yee ◽  
Tae-Im Park ◽  
So-Youn Shin ◽  
Man-Ho Ha ◽  
...  

Predicting the clinical progression of intensive care unit (ICU) patients is crucial for survival and prognosis. Therefore, this retrospective study aimed to develop the risk scoring system of mortality and the prediction model of ICU length of stay (LOS) among patients admitted to the ICU. Data from ICU patients aged at least 18 years who received parenteral nutrition support for ≥50% of the daily calorie requirement from February 2014 to January 2018 were collected. In-hospital mortality and log-transformed LOS were analyzed by logistic regression and linear regression, respectively. For calculating risk scores, each coefficient was obtained based on regression model. Of 445 patients, 97 patients died in the ICU; the observed mortality rate was 21.8%. Using logistic regression analysis, APACHE II score (15–29: 1 point, 30 or higher: 2 points), qSOFA score ≥ 2 (2 points), serum albumin level < 3.4 g/dL (1 point), and infectious or respiratory disease (1 point) were incorporated into risk scoring system for mortality; patients with 0, 1, 2–4, and 5–6 points had approximately 10%, 20%, 40%, and 65% risk of death. For LOS, linear regression analysis showed the following prediction equation: log(LOS) = 0.01 × (APACHE II) + 0.04 × (total bilirubin) − 0.09 × (admission diagnosis of gastrointestinal disease or injury, poisoning, or other external cause) + 0.970. Our study provides the mortality risk score and LOS prediction equation. It could help clinicians to identify those at risk and optimize ICU management.


2020 ◽  
Vol 79 (Suppl 1) ◽  
pp. 1953.3-1953
Author(s):  
J. Guo ◽  
W. Zhou ◽  
M. He ◽  
Z. Gu ◽  
C. Dong

Background:Fatigue of chronic diseases has been paid more and more attention. but the status of fatigue in gout patients has not been reported all the world[1].Objectives:In the absence of previous studies, our study aims to investigate the fatigue status, explore the potential predictors of fatigue and the effects of fatigue on health-related quality of life (HRQoL) among Chinese gout patients.Methods:This cross-sectional study was conducted from the Affiliated Hospital of Nantong University. A series of questionnaires were applied: Fatigue Scale-14 (FS-14), the 10 cm visual analog scale (VAS), the Patient Health Questionnaire (PHQ-9), the Generalized Anxiety Disorder questionnaire (GAD-7), the Pittsburgh Sleep Quality Index (PSQI), Health Assessment Questionnaire(HAQ), the Short Form 36 health survey (SF-36). Laboratory examinations were taken to obtain some biochemical indicators. Independent samples t-test, Mann–Whitney U-test, Chi-square analysis, Pearson /Spearman correlation, Stepwise linear regression and binary logistic regression were used to analyze the data.Results:411 gout patients were included in this study. Among them, more than 50% patients reported physical fatigue in FS-14, severe disease, poor psychological status and reduced HRQoL were associated with fatigue. Multiple stepwise linear regression and binary logistic regression were applied and showed that pain, sleep quality, anxiety, depression and functional disorder were the potential predictors of fatigue. In addition, we found that the more severe the fatigue, the lower the patient’s HRQoL.Conclusion:Fatigue among gout patients is exceedingly common. The results of this study suggested that rheumatologists should pay closely attention to gout patients who suffer from serious fatigue, especially those with pain, poorer sleep quality, anxiety, depression and functional disorder.References:[1]Henry, A., Tourbah, A., Camus, G., Deschamps, R., Mailhan, L., Castex, C., Gout, O. & Montreuil, M. (2019) Anxiety and depression in patients with multiple sclerosis: The mediating effects of perceived social support, Multiple sclerosis and related disorders. 27, 46-51.Disclosure of Interests:None declared


2020 ◽  
Vol 20 (1) ◽  
Author(s):  
Wolf Ramackers ◽  
Julia Victoria Stupak ◽  
Indra Louisa Marcheel ◽  
Annette Tuffs ◽  
Harald Schrem ◽  
...  

Abstract Background Students’ ratings of bedside teaching courses are difficult to evaluate and to comprehend. Validated systematic analyses of influences on students’ perception and valuation of bedside teaching can serve as the basis for targeted improvements. Methods Six hundred seventy-two observations were conducted in different surgical departments. Survey items covered the categories teacher’s performance, student’s self-perception and organizational structures. Relevant factors for the student overall rating were identified by multivariable linear regression after exclusion of variable correlations > 0.500. The main target for intervention was identified by the 15% worst overall ratings via multivariable logistic regression. Results According to the students the success of bedside teaching depended on their active participation and the teacher’s explanations of pathophysiology. Further items are both relevant to the overall rating and a possible negative perception of the session. In comparison, negative perception of courses (worst 15%) is influenced by fewer variables than overall rating. Variables that appear in both calculations show slight differences in their weighing for their respective endpoints. Conclusion Relevant factors for overall rating and negative perception in bedside teaching can be identified by regression analyses of survey data. Analyses provide the basis for targeted improvement.


2021 ◽  
pp. 1-10
Author(s):  
Yosuke Yamada ◽  
Hiroyuki Umegaki ◽  
Fumie Kinoshita ◽  
Chi Hsien Huang ◽  
Taiki Sugimoto ◽  
...  

Background: Homocysteine is a common risk factor for cognitive impairment and sarcopenia. However, very few studies have shown an association between sarcopenia and serum homocysteine levels after adjustment for cognitive function. Objective: The purpose of this study was to investigate the relationship between homocysteine and sarcopenia in memory clinic patients. Methods: This cross-sectional study investigated outpatients in a memory clinic. We enrolled 1,774 participants (≥65 years old) with measured skeletal muscle mass index (SMI), hand grip strength (HGS), and homocysteine. All participants had undergone cognitive assessments and were diagnosed with dementia, mild cognitive impairment, or normal cognition. Patient characteristics were compared according to sarcopenia presence, SMI level, or HGS. Multivariate logistic regression analysis was performed to determine the association of homocysteine with sarcopenia, low SMI, or low HGS. Next, linear regression analysis was performed using HGS as a continuous variable. Results: Logistic regression analysis showed that low HGS was significantly associated with homocysteine levels (p = 0.002), but sarcopenia and low SMI were not. In linear regression analysis, HGS was negatively associated with homocysteine levels after adjustment for Mini-Mental State Examination score (β= –2.790, p <  0.001) or clinical diagnosis of dementia (β= –3.145, p <  0.001). These results were similar for men and women. Conclusion: Our results showed a negative association between homocysteine and HGS after adjustment for cognitive function. Our findings strengthen the assumed association between homocysteine and HGS. Further research is needed to determine whether lower homocysteine levels lead to prevent muscle weakness.


2007 ◽  
Author(s):  
Φωτούλα Μπαμπάτσικου

Με δεδομένη τη γήρανση του Ελληνικού πληθυσμού, αντικείμενο της διατριβής αυτής αποτέλεσε η αξιολόγηση της κατάστασης υγείας των ηλικιωμένων και η μελέτη παραγόντων που ενδέχεται να επηρεάζουν ορισμένες συχνές νοσολογικές καταστάσεις στην τρίτη ηλικία. Η έρευνα πραγματοποιήθηκε σε τέσσερα Κ.Α.Π.Η. της Αττικής. Μελετήθηκαν 426 άτομα, 245 γυναίκες και 181 άνδρες, ηλικίας 60 ετών και άνω. Η συλλογή των στοιχείων έγινε με συνέντευξη με τους ηλικιωμένους για συλλογή δεδομένων σχετικών με το ιατρικό ιστορικό, τον τρόπο ζωής και τις διατροφικές συνήθειες. Χρησιμοποιήθηκε ένα κοινό βασικό ερωτηματολόγιο και ένα ειδικό κατά φύλο ερωτηματολόγιο ανδρών ή γυναικών. Έγινε εκτίμηση της διανοητικής εγρήγορσης με τη χρήση της κλίμακας Mini Mental State Examination (MMSE) και της θυμικής κατάστασης με την κλίμακα Geriatric Depression Scale-15 (GDS-15). Μετρήθηκε επίσης η αρτηριακή πίεση των ατόμων της έρευνας καθώς και βασικοί σωματομετρικοί δείκτες. Τα κυριότερα ευρήματα της μελέτης είναι τα ακόλουθα: • Σχεδόν τα δύο τρίτα των γυναικών (63,3%) μπορούν να χαρακτηριστούν παχύσαρκες, ενώ το αντίστοιχο ποσοστό στους άνδρες είναι 41,4%. Είναι προφανές ότι η παχυσαρκία, που περιγράφεται πια ως σημαντικό πρόβλημα των Ελλήνων, αφορά και τους ηλικιωμένους. • Η διατροφή των ηλικιωμένων δεν απέχει πολύ από την παραδοσιακή Μεσογειακή διατροφή, αφού στο διαιτολόγιο δεσπόζουν τα λαχανικά, τα φρούτα, τα δημητριακά και το ελαιόλαδο. Εντούτοις, παρατηρείται αυξημένη κατανάλωση κρέατος και σχετικά χαμηλή κατανάλωση ψαριών. • Η σωματική δραστηριότητα των ατόμων του δείγματος ήταν γενικά περιορισμένη και η συστηματική άθληση ελάχιστη. • Περισσότερα από τα δύο τρίτα των ανδρών υπήρξαν ή είναι καπνιστές, αν και μόνο 13,8% συνεχίζουν να καπνίζουν. Αντίθετα, στις γυναίκες λιγότερο από το ένα τέταρτο υπήρξαν ή είναι καπνίστριες, αλλά οι μισές από αυτές εξακολουθούν να καπνίζουν. • Σχεδόν δύο τρίτα των ανδρών (64,1%) και σχεδόν ένα τέταρτο των γυναικών (24,5%) ανέφεραν γενετήσια δραστηριότητα στη διάρκεια του έτους που προηγήθηκε. • Περισσότεροι από 20% τόσο των ανδρών όσο και των γυναικών ανέφεραν διαγνωσμένο σακχαρώδη διαβήτη, ενώ όσον αφορά το ιστορικό στεφανιαίας νόσου και αγγειακού εγκεφαλικού επεισοδίου, τα αντίστοιχα ποσοστά στους άνδρες ήταν 27,6% και 10,5%, και στις γυναίκες 10,2% και 5,3%. Στους άνδρες, το ποσοστό των υπερτασικών ήταν 72,9% και στις γυναίκες 77,1%. Περισσότερες γυναίκες (37,1%) παρά άνδρες (26,5%) ανέφεραν ένα ή περισσότερα κατάγματα οστών. Περίπου οι μισοί άνδρες (45,3%) ανέφεραν διαγνωσμένη υπερπλασία του προστάτη. • Η βαθμολόγηση στην κλίμακα MMSE περίπου ενός στους δέκα ηλικιωμένους (9,4% μεταξύ των ανδρών και 9,8% μεταξύ των γυναικών) ήταν δηλωτική ουσιαστικής γνωσιακής έκπτωσης. • Τριπλάσιο ποσοστό γυναικών (18,4%) σε σχέση με τους άνδρες (6,1%) εμφάνιζαν στοιχεία σοβαρής κατάθλιψης με βάση την απόδοσή τους στην κλίμακα GDS-15. Διάφορες παράμετροι υγείας ή νοσηρότητας εξετάστηκαν ως εξαρτημένες μεταβλητές σε πολυπαραγοντικές εξαρτήσεις είτε απλής γραμμικής μορφής (simple linear regression) για εξαρτημένες μεταβλητές συνεχούς ποσοστικού χαρακτήρα, είτε λογαριθμικής μορφής (logistic regression) για ποιοτικές κατηγορικές μεταβλητές. Μεταξύ των ευρημάτων που αναδείχθηκαν σημειώνονται τα ακόλουθα: • Τα κατάγματα είναι συχνότερα στις γυναίκες παρά στους άνδρες, καθώς και σε άτομα χαμηλότερης εκπαίδευσης. Το κάπνισμα, είτε ως ενδεικτικό ενός πιο «ριψοκίνδυνου» τρόπου ζωής ή λόγω της αρνητικής συσχέτισής του με τα επίπεδα ορισμένων στεροειδών ορμονών, σχετίζεται σε βαθμό στατιστικά σημαντικό με το ιστορικό καταγμάτων. • Η συχνότητα υπέρτασης αυξάνεται σε συνάρτηση με την ηλικία σε βαθμό στατιστικά σημαντικό, ενώ υπάρχει ένδειξη ότι η κατανάλωση ελαιολάδου σχετίζεται αρνητικά με την αρτηριακή υπέρταση (p~0,074). • Υπάρχει στατιστικά σημαντική αρνητική σχέση μεταξύ υπερπλασίας του προστάτη και αναφοράς οργασμού(-ων) κατά το τελευταίο έτος, η οποία βέβαια μπορεί να αξιολογηθεί μόνο ως συσχέτιση και όχι ως αιτιότητα. Η αυξημένη πρόσληψη προστιθέμενων λιπιδίων, μετά από προτύπωση για την προσλαμβανόμενη ενέργεια, αυξάνει την πιθανότητα υπερπλασίας του προστάτη. Από πρόσθετες αναλύσεις προκύπτει ότι τα πρόσθετα λιπίδια τα οποία σχετίζονται θετικά με την υπερπλασία του προστάτη είναι τα κορεσμένα ζωϊκά λίπη, με σχετικό κίνδυνο 2,59 για αύξηση της συχνότητας κατανάλωσης βουτύρου κατά μία φορά την ημέρα (p~0.032). Αξιοσημείωτη είναι η αρνητική σχέση μεταξύ φυσικής δραστηριότητας και υπερπλασίας του προστάτη, μολονότι στα δεδομένα αυτά δεν είναι στατιστικά σημαντική (p~0,103). • Αναμενόμενη είναι η αναφερόμενη μείωση γενετήσιας δραστηριότητας σε μεγαλύτερες ηλικίες. Η γενετήσια δραστηριότητα παρουσιάζει τάση μείωσης σε συνάρτηση με το κάπνισμα (p~0.189), ενώ παρατηρείται ενδεικτική θετική συσχέτιση μεταξύ χοληστερόλης του αίματος και διατήρησης γενετήσιας δραστηριότητας. • Προϊούσης της ηλικίας υπάρχει μείωση της διανοητικής ικανότητας (p<10⁻³), η οποία σχετίζεται θετικά με το επίπεδο εκπαίδευσης (p<10⁻³) και αρνητικά με το βαθμό κατάθλιψης (p~0,002). Ούτε η συγκατοίκηση, ούτε το κάπνισμα φαίνεται να έχουν σχέση με τη διανοητική ικανότητα. • Ο βαθμός κατάθλιψης είναι σημαντικότερος στις γυναίκες παρά στους άνδρες (p<10⁻³) και είναι μεγαλύτερος σε άτομα που ζουν μόνα τους (p~0,001). Συμπερασματικά, με βάση την έρευνα αυτή, διαπιστώθηκαν ο υψηλός επιπολασμός της παχυσαρκίας, του σακχαρώδη διαβήτη, της αρτηριακής υπέρτασης της στεφανιαίας νόσου και, μεταξύ των ανδρών, της καλοήθους υπερπλασίας του προστάτη μεταξύ των ηλικιωμένων Ελλήνων. Σε έρευνες επιπολασμού, όπως αυτή, δεν μπορεί να συνεκτιμηθεί με αξιοπιστία η συχνότητα των κακοήθων νεοπλασιών, αφού η μεγάλη θνητότητα και η βραχύτερη επιβίωση δημιουργούν αρνητική επιλογή και ποικίλο βαθμό υποεκτίμησης ανά είδος καρκίνου. Μεταξύ των περιπατητικών και κοινωνικά λειτουργικών ατόμων του δείγματός μας, περίπου ένας στους δέκα εμφανίζουν σημαντικό βαθμό γνωσιακής υπολειματικότητας, ενώ σημαντικό ποσοστό γυναικών και μικρότερο ποσοστό μεταξύ των ανδρών έχουν εκδηλώσεις κατάθλιψης. Η διατροφή των ηλικιωμένων είναι από ποιοτική άποψη ικανοποιητική, μολονότι θα ήταν επιθυμητή η μείωση των προσλαμβανόμενων ζωϊκών πρωτεϊνών και η αύξηση των σύνθετων υδατανθράκων. Ελάχιστοι ηλικιωμένοι έχουν επιθυμητά επίπεδα φυσικής δραστηριότητας και το γεγονός αυτό συμβάλει στους υψηλούς δείκτες παχυσαρκίας. Περίπου 12% των ηλικιωμένων παραμένουν ενεργοί καπνιστές, ενώ τα δύο τρίτα των ανδρών και το ένα τέταρτο των γυναικών αναφέρουν ενεργό ερωτική ζωή. Αρκετοί τεκμηριωμένοι παράγοντες κινδύνου για μια σειρά από τα υψηλού επιπολασμού νοσήματα αναδεικνύονται στην έρευνα αυτή και επιτρέπουν τη διαμόρφωση προτεραιοτήτων δημόσιας υγείας σε έναν πληθυσμό σαν τον Ελληνικό, μεγάλο και αυξανόμενο ποσοστό του οποίου κατατάσσεται στην τρίτη ηλικία.


Sign in / Sign up

Export Citation Format

Share Document